Open Data · CC BY 4.0 · DOI Zenodo

Open Data: polskie przetargi publiczne (BZP + TED, 1,4 mln rekordów)

Otwarta baza zamówień publicznych w Polsce za lata 2024-2025: 1 403 436 ogłoszeń, 23 753 profili zamawiających, 81 674 profili wykonawców. Pobierz z Zenodo (z DOI do cytowania), Kaggle lub GitHub. Licencja CC BY 4.0 — użycie komercyjne i niekomercyjne.

1,4 mln
ogłoszeń BZP+TED
23,7 tys.
profili zamawiających
81,7 tys.
profili wykonawców
2024-2025
pełen zakres czasowy

Pobierz z trzech platform

Zenodo (preferowane)

DOI nadane przez CERN — preferowane źródło cytowania w pracach naukowych. Long-term preservation, zgodne z FAIR data principles.

  • • DOI: 10.5281/zenodo.19634050
  • • Format: Parquet + CSV
  • • Zotero / Mendeley compatible
Otwórz w Zenodo

Kaggle

Idealne dla notebooków Jupyter, ML training i data science exploration. Wbudowany dataset viewer i kernel runner.

  • • Format: CSV (gzipped)
  • • Interactive notebooks
  • • API kaggle CLI
Otwórz na Kaggle

GitHub

Pełen kontrolowany version history. Każda wersja ma swój git tag, można łatwo zreprodukować analizy historyczne.

  • • Format: Parquet (zstd)
  • • Aktualna wersja: v2026.Q2
  • • git clone / DuckDB SQL
Otwórz w GitHub

Quick start

Python (pandas)
import pandas as pd

df = pd.read_parquet(
  "https://github.com/atlasprzetargow/"
  "polish-tenders-dataset/raw/main/"
  "data/tenders_2025.parquet"
)

print(df.shape)
print(df.columns)
DuckDB SQL
SELECT province,
       COUNT(*),
       SUM(estimated_value)
FROM 'https://github.com/atlasprzetargow/
  polish-tenders-dataset/raw/main/
  data/tenders_2025.parquet'
WHERE is_duplicate = false
GROUP BY province
ORDER BY 2 DESC;

Metodologia

Źródła

BZP (OCDS JSON API) + TED (eForms XML) — oba oficjalne, oba publiczne. Brak scrapingu ekstraktywnego — używamy oficjalnych endpointów.

Deduplikacja

Ogłoszenia TED które są kopiami BZP (publikacja UE dla zamówień powyżej progów unijnych) są oznaczone flagą is_duplicate=true.

Normalizacja

NIP → 10-cyfrowy format (nip_normalized), województwo → kod NUTS-2 PLxx, miasta geokodowane do lat/lng.

RODO / GDPR

Wykonawcy będący osobami fizycznymi (CEIDG/PESEL detection) są zanonimizowani —name="[Osoba fizyczna]", ID jako stabilny hash. Zamawiający NIE są anonimizowani (podmioty publiczne).

Cytowanie

Atlas Przetargów (2026). Polish Public Tenders Dataset (BZP + TED), version 2026.Q2. Zenodo. https://doi.org/10.5281/zenodo.19634050
Plik CITATION.cff w repozytorium GitHub jest kompatybilny z Zotero, Mendeley i Google Scholar.

Eksploruj dane przez interfejs

Jeśli nie chcesz pobierać całego datasetu, użyj wyszukiwarki, filtrów i map interaktywnych Atlas Przetargów.