Open Data: polskie przetargi publiczne (BZP + TED, 1,4 mln rekordów)
Otwarta baza zamówień publicznych w Polsce za lata 2024-2025: 1 403 436 ogłoszeń, 23 753 profili zamawiających, 81 674 profili wykonawców. Pobierz z Zenodo (z DOI do cytowania), Kaggle lub GitHub. Licencja CC BY 4.0 — użycie komercyjne i niekomercyjne.
Pobierz z trzech platform
Zenodo (preferowane)
DOI nadane przez CERN — preferowane źródło cytowania w pracach naukowych. Long-term preservation, zgodne z FAIR data principles.
- • DOI:
10.5281/zenodo.19634050 - • Format: Parquet + CSV
- • Zotero / Mendeley compatible
Kaggle
Idealne dla notebooków Jupyter, ML training i data science exploration. Wbudowany dataset viewer i kernel runner.
- • Format: CSV (gzipped)
- • Interactive notebooks
- • API kaggle CLI
GitHub
Pełen kontrolowany version history. Każda wersja ma swój git tag, można łatwo zreprodukować analizy historyczne.
- • Format: Parquet (zstd)
- • Aktualna wersja: v2026.Q2
- • git clone / DuckDB SQL
Quick start
import pandas as pd df = pd.read_parquet( "https://github.com/atlasprzetargow/" "polish-tenders-dataset/raw/main/" "data/tenders_2025.parquet" ) print(df.shape) print(df.columns)
SELECT province,
COUNT(*),
SUM(estimated_value)
FROM 'https://github.com/atlasprzetargow/
polish-tenders-dataset/raw/main/
data/tenders_2025.parquet'
WHERE is_duplicate = false
GROUP BY province
ORDER BY 2 DESC;Metodologia
Źródła
BZP (OCDS JSON API) + TED (eForms XML) — oba oficjalne, oba publiczne. Brak scrapingu ekstraktywnego — używamy oficjalnych endpointów.
Deduplikacja
Ogłoszenia TED które są kopiami BZP (publikacja UE dla zamówień powyżej progów unijnych) są oznaczone flagą is_duplicate=true.
Normalizacja
NIP → 10-cyfrowy format (nip_normalized), województwo → kod NUTS-2 PLxx, miasta geokodowane do lat/lng.
RODO / GDPR
Wykonawcy będący osobami fizycznymi (CEIDG/PESEL detection) są zanonimizowani —name="[Osoba fizyczna]", ID jako stabilny hash. Zamawiający NIE są anonimizowani (podmioty publiczne).
Cytowanie
Atlas Przetargów (2026). Polish Public Tenders Dataset (BZP + TED), version 2026.Q2. Zenodo. https://doi.org/10.5281/zenodo.19634050
Eksploruj dane przez interfejs
Jeśli nie chcesz pobierać całego datasetu, użyj wyszukiwarki, filtrów i map interaktywnych Atlas Przetargów.