Ostatnia aktualizacja: 21 marca 2026

Jak Atlas Przetargów zbiera i przetwarza dane

Źródła danych, harmonogram aktualizacji, proces normalizacji i kontrola jakości — krok po kroku.

Źródła danych

Dwa oficjalne źródła, jeden uporządkowany zbiór

Pracujemy na danych z polskiego BZP (platforma e-Zamówienia) i europejskiego TED. Oba źródła są publiczne i oficjalne. Atlas je łączy, normalizuje i przetwarza w spójną bazę z filtrami, profilami podmiotów i analityką.

Źródło krajowe

BZP / e-Zamówienia

Ogłoszenia publikowane na platformie e-Zamówienia przez zamawiających z całej Polski. To główny strumień danych — obejmuje postępowania krajowe poniżej i powyżej progów unijnych.

  • ogłoszenia o zamówieniu i wyniki postępowań
  • zmiany i korekty ogłoszeń
  • dane zamawiających (NIP, adres, kontakt)
Oficjalna strona
Źródło unijne

TED (Tenders Electronic Daily)

Europejski dziennik zamówień publicznych. Pobieramy dane przez TED Search API i wzbogacamy je o pola z notice XML — wartości szacunkowe, kody CPV i informacje o wykonawcach.

  • zamówienia powyżej progów unijnych
  • dane kontraktów i wykonawców z wyników
  • powiązanie z rekordami krajowymi przez numer referencyjny
Oficjalna strona
Częstotliwość aktualizacji

BZP: co 4 godziny

Worker pobiera nowe i zmienione ogłoszenia z publicznego API e-Zamówień. Typowe opóźnienie: 1-4 godziny od momentu publikacji.

TED: raz dziennie

Osobny worker synchronizuje dane z TED Search API w cyklu dobowym. Rekordy są łączone z BZP tam, gdzie numer referencyjny się zgadza.

Cofanie się po poprawki

Każda synchronizacja cofa się o krótkie okno czasowe, żeby złapać ogłoszenia opublikowane z opóźnieniem lub poprawione po pierwszej publikacji.

Proces przetwarzania

Każde ogłoszenie przechodzi 5 kroków, zanim pojawi się w wyszukiwarce.

1. Pobranie ogłoszenia

System pobiera nowe i zmienione ogłoszenia z BZP lub TED. Zachowujemy oryginalny numer i datę publikacji.

2. Sprawdzenie duplikatów

Weryfikujemy, czy ogłoszenie jest już w bazie. Nowe — zapisujemy. Zmienione (korekta, wynik postępowania) — aktualizujemy istniejący wpis.

3. Ujednolicenie danych

Nazwy miast i województw sprowadzamy do jednej formy, kody CPV przypisujemy do kategorii branżowych, wartości i terminy zapisujemy w spójnym formacie.

4. Łączenie BZP z TED

Próbujemy powiązać ogłoszenie krajowe z unijnym przez numer referencyjny. Gdy dopasowanie jest niepewne, zostawiamy wpisy osobno — lepiej nie łączyć niż połączyć błędnie.

5. Udostępnienie w wyszukiwarce

Przetworzone ogłoszenie trafia do wyszukiwarki, bazy filtrów i analityki oraz pamięci podręcznej, która przyspiesza ładowanie wyników.

Otwarte zasoby dla deweloperów i badaczy

Atlas otwiera dane i narzędzia, nie tylko interfejs

Jeśli chcesz pracować z danymi bezpośrednio — pobrać surowy zbiór, cytować w pracy naukowej, podłączyć asystenta AI albo zbudować własną integrację — udostępniamy do tego sześć kanałów. Wszystkie publiczne, większość bez klucza, bez opłat.

Open Data

Dataset na GitHubie

Pełna baza Atlasu (1,4 mln ogłoszeń BZP + TED, 2024–2025) jako otwarty zbiór danych. Format Parquet (zalecany) + gzipped CSV. Licencja CC BY 4.0 dla danych, MIT dla kodu eksportu i anonimizacji.

github.com/atlasprzetargow/polish-tenders-dataset
DOI · cytowanie naukowe

Zenodo: DOI 10.5281/zenodo.19634050

Stabilna wersja archiwalna z DOI dla cytowań w pracach naukowych. Concept DOI 10.5281/zenodo.19634049 zawsze rezolwuje najnowszą wersję. Plik CITATION.cff w repo czytany przez Zotero, Mendeley i Google Scholar.

doi.org/10.5281/zenodo.19634050
MCP Server · AI assistants

Atlas w Claude Desktop, Cursor, Continue

Pierwszy polski Model Context Protocol server dla zamówień publicznych. Cztery linie konfiguracji JSON i Twój asystent AI ma realtime dostęp do bazy: 8 narzędzi, 4 zasoby (słownik 91 terminów + wiki), 3 prompty (analiza, due diligence, okazje).

@atlasprzetargow/mcp na npm
REST API

API publiczne bez klucza

Endpointy `/api/tenders`, `/api/buyers/<nip>`, `/api/contractors/<nip>`, `/api/tenders/agg/*` dostępne bez autentykacji do publicznych pól. Klucz API odblokowuje AI summaries (`/api/llm/*`). Rate limit 60 req/min dla anonimowych.

atlasprzetargow.pl/api
Anonimizacja w open-datasecie

Środek ostrożności dla bulk-redistribution

Dane wykonawców z BZP i TED są z mocy prawa publiczne (art. 269 PZP, publikacja w oficjalnym biuletynie). W interfejsie Atlasu pokazujemy je bez zmian. Dodatkowo w publikowanym pakiecie open-data wykonawcy będący osobami fizycznymi (CEIDG, jednoosobowa działalność) są zahashowani stabilnym SHA-256 — to dobrowolny środek ostrożności przy zbiorczej redystrybucji danych na licencji CC BY, nie wymóg RODO. Kod detekcji w pii_utils.py (MIT).

schema/tenders.md#anonymization
Kontrola jakości
  • Bez duplikatów: ponowne pobranie tych samych ogłoszeń nie tworzy kopii w bazie.
  • Rozróżnienie typów: osobno traktujemy ogłoszenia o zamówieniu, wyniki postępowań, zmiany i sprostowania.
  • Bezpieczeństwo treści: dane z BZP i TED czyścimy z potencjalnie szkodliwego kodu przed wyświetleniem.
  • Spójne lokalizacje: „Warszawa", „WARSZAWA", „m.st. Warszawa" → jedna wartość w filtrach i na mapie.
  • Uzupełnianie danych: gdy źródło dodaje pola po czasie (np. wartość kontraktu w wyniku), aktualizujemy wpis.
  • Zgłoszenia użytkowników: każdy e-mail o błędnych danych porównujemy z dokumentacją źródłową i poprawiamy.
Zakres i ograniczenia
  • W sprawach formalnych wiążące pozostają publikacje na e-Zamówienia (BZP) lub TED i dokumentacja postępowania — Atlas jest warstwą analityczną, nie źródłem prawnym.
  • Nie wszystkie rekordy z BZP i TED dają się połączyć — gdy identyfikatory się nie zgadzają, zostawiamy rekordy osobno. Lepiej nie łączyć niż połączyć błędnie.
  • Część pól (np. wartość kontraktu) pojawia się w źródle dopiero po rozstrzygnięciu — do tego czasu mogą być puste w Atlasie.
  • Normalizacja zmienia format danych (np. „m.st. Warszawa" → „Warszawa") — oryginalne brzmienie zawsze dostępne w źródle.
Zgłaszanie błędów

Coś się nie zgadza? Napisz

Jeśli dane w Atlasie nie zgadzają się z oficjalną publikacją lub brakuje ważnego pola, wyślij nam e-mail z linkiem do strony. Porównamy z dokumentacją źródłową i poprawimy.

kontakt@atlasprzetargow.pl

W zgłoszeniu podaj link do strony i identyfikator przetargu (numer BZP lub TED), żebyśmy mogli szybko porównać z oryginałem.

Najczęstsze pytania

Czy w Atlasie są tylko nowe ogłoszenia?

Nie. Baza zawiera ogłoszenia otwierające postępowanie, wyniki, zmiany i dane historyczne. Na liście przetargów domyślnie pokazujemy aktywne postępowania, ale można przeszukiwać też archiwum.

Dlaczego przy niektórych przetargach brakuje wartości szacunkowej?

Bo zamawiający nie zawsze podaje ją w ogłoszeniu. Wartość pojawia się najczęściej w wyniku postępowania. Atlas pokazuje to, co jest dostępne w źródle.

Czy mogę pobrać surowy zbiór danych z Atlasu?

Tak. Pełny dataset (1,4 mln ogłoszeń BZP + TED, 2024–2025) jest dostępny na licencji CC BY 4.0 w trzech kanałach: GitHub (github.com/atlasprzetargow/polish-tenders-dataset), Zenodo z DOI dla cytowań naukowych (doi.org/10.5281/zenodo.19634050) i Kaggle (kaggle.com/datasets/michalpozoga/polish-public-tenders). Format: Parquet (zalecany) i gzipped CSV.

Czy mogę podłączyć Atlasa do mojego asystenta AI?

Tak. Pierwszy polski Model Context Protocol server dla zamówień publicznych jest dostępny jako paczka @atlasprzetargow/mcp na npm. Cztery linie konfiguracji w Claude Desktop, Cursor lub Continue dają asystentowi realtime dostęp do bazy: 8 narzędzi, 4 zasoby, 3 prompty.

Jak traktujemy dane wykonawców w kontekście ochrony danych?

Wyniki postępowań publicznych — w tym nazwa i NIP wykonawcy, również jednoosobowej działalności — są z mocy prawa publiczne: PZP art. 269 nakazuje ich publikację w BZP, a EU Open Data Directive 2019/1024 zachęca do re-use. W interfejsie Atlas pokazuje te dane bez modyfikacji. W publikowanym pakiecie open-data (GitHub, Kaggle, Zenodo) dodatkowo hashujemy NIP-y wykonawców rozpoznanych jako osoby fizyczne (stabilny SHA-256 z solą) — to dobrowolny środek ostrożności przy zbiorczej redystrybucji na licencji CC BY, nie obligatoryjne wymaganie RODO. Heurystyka detekcji (lista polskich imion + wzorce CEIDG) jest w pii_utils.py na licencji MIT.

Jak zgłosić błąd lub brakujące dane?

Napisz na kontakt@atlasprzetargow.pl z linkiem do strony i opisem problemu. Porównujemy z publikacją źródłową i poprawiamy dane lub regułę przetwarzania.

Zobacz dane w praktyce

Szukaj ogłoszeń po branży, regionie, wartości i terminie — albo sprawdź analitykę rynku i profile zamawiających.