From legal-data-hunter-pl
Catalog and bulk-harvest layer for Polish legal data, built on the Legal Data Hunter project (worldwidelaw/legal-sources). Use this skill whenever the user wants to know which Polish legal sources are already available, bulk-download Polish legislation, case law or regulator decisions (UODO, UOKiK, KNF, UKE, URE, KIO, NSA, Trybunal Konstytucyjny, Sad Najwyzszy, Dziennik Urzedowy, Sejm ELI), build a local RODO-safe corpus of Polish law, or decide whether MateMatic needs to build its own connector for a gap. Trigger on "Legal Data Hunter", "pokrycie polskiego prawa", "zaciagnij ustawy", "harvest orzecznictwa", "ktore zrodla mamy", "luka w zrodlach". Companion to saos-orzecznictwo (live query) and eu-sparql-search (EU law).
How this skill is triggered — by the user, by Claude, or both
Slash command
/legal-data-hunter-pl:legal-data-hunter-plThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
Warstwa "katalog + harvest" projektu legal AI MateMatic. Mapuje, co z polskiego
Warstwa "katalog + harvest" projektu legal AI MateMatic. Mapuje, co z polskiego prawa jest juz dostepne gotowymi kolektorami, i wskazuje luki do uzupelnienia wlasnymi konektorami.
worldwidelaw/legal-sources (Legal Data Hunter) - otwarte repo skryptow zbierania
otwartych danych prawnych z 110+ krajow (960+ kolektorow). Kazdy kolektor pobiera
i normalizuje dane z oficjalnego portalu/API rzadowego do wspolnego schematu.
license: w config.yaml danego zrodla (np. SAOS = public domain).Sparse-clone polskiej czesci jest w ~/legal-data-hunter/
(17 MB; sources/PL/ + framework common/ + runner.py). Aktualizacja:
cd ~/legal-data-hunter && git pull
Pelne repo to 388 MB - NIE klonuj calosci, sparse-checkout wystarcza:
git clone --filter=blob:none --no-checkout --depth 1 \
https://github.com/worldwidelaw/legal-sources.git legal-data-hunter
cd legal-data-hunter
git config index.sparse true
git sparse-checkout init --cone --sparse-index
git sparse-checkout set sources/PL common docs
git checkout
⚠️
--sparse-indexjest KONIECZNY na Windows - bez niegogit checkoutwywala sie na sciezkach z:w nazwie (US/Louisiana) mimo cone-mode.
Pelna tabela ze statusem, API i licencja: references/coverage-pl.md.
Dziala (13 zrodel) - legislacja, orzecznictwo, regulatorzy, podatki:
DziennikUrzedowy, Sejm (ELI API, 96K aktow - oznaczony untested)ConstitutionalCourt (TK), SupremeCourt (SN), NSA, KIO,
SAOS (hurtowe archiwum wszystkich sadow)KNF, UODO, UOKIK, UKE, UREKIS-EUREKA, NSA-TaxZablokowane / luki (3 zrodla):
SN - sn.pl w konserwacji, alternatywa SAOS zawiesila sie (osobne zrodlo
SupremeCourt dziala - ta pozycja to redundantny, zepsuty wariant)MF - interpretacje podatkowe sip.mf.gov.pl, API EUREKA geo-blokowane/WAF
(czesciowo zastepuje je dzialajacy KIS-EUREKA)To pokrywa wieksza czesc opublikowanego polskiego prawa - stad teza "~80%".
| Luka | Dlaczego | Plan MateMatic |
|---|---|---|
| Biezace orzeczenia sadow powszechnych | LDH ma je tylko przez SAOS, a SAOS to archiwum konczace sie ~2018 | wlasny konektor do portali orzeczen orzeczenia.ms.gov.pl |
| Interpretacje podatkowe MF | zrodlo MF zablokowane (WAF/geo) | wlasny konektor lub oprzec sie na KIS-EUREKA |
| KRS - rejestr przedsiebiorcow | brak w sources/PL w ogole | skille gaius-lex (KRS) juz w MateMatic; ew. wlasny konektor MCP |
| Monitor Polski | jawnie nieindeksowany | do rozwazenia |
| Wyszukiwanie interaktywne (live query) | kolektory LDH to HARVESTERY (hurt), nie API zapytan | wlasne konektory zapytan: skill saos-orzecznictwo, przyszle ISAP/KRS |
Trzy warstwy dostepu do polskiego prawa - nie konkuruja, uzupelniaja sie:
saos-orzecznictwo
(interaktywne wyszukiwanie orzeczen), przyszle ISAP/KRS. To jest moat.eu-sparql-search (EUR-Lex/CJEU).Kolektor SAOS w LDH (sources/PL/SAOS) uzywa tylko Dump API (hurtowe archiwum,
append-only). Skill saos-orzecznictwo uzywa Search/Browse API (zapytania na
zywo). To NIE jest dublowanie - jedno zasila lokalny indeks, drugie odpowiada na
pytanie tu i teraz.
⚠️ Hostowane Search API legaldatahunter.com to zaleznosc chmurowa - sprzeczna z teza zero-cloud MateMatic (RODO-safe self-hosted stack). Do produktu dla kancelarii uruchamiaj kolektory lokalnie i trzymaj korpus u siebie. Hostowane API jest OK tylko do szybkiego rozpoznania/dev.
Framework: Python. Zaleznosci w requirements.txt (core: requests, pyyaml,
beautifulsoup4, lxml; ciezsze opcjonalne: playwright, psycopg2-binary,
opendataloader-pdf). Core jest juz zainstalowany na tej maszynie.
cd ~/legal-data-hunter
python runner.py status # przeglad stanu projektu
python runner.py sample PL/SAOS # tryb probny - 10+ rekordow do walidacji
python runner.py test PL/UODO # test kolektora
python runner.py fast PL/KIO # bootstrap_fast
Struktura kazdego zrodla sources/PL/<Nazwa>/:
bootstrap.py - kolektor: fetch_all(), fetch_updates(), normalize()config.yaml - metadane, API, rate-limit, schema, licencja danychstatus.yaml - historia uruchomien (jesli byl uruchamiany)sample/ - 10+ rekordow do walidacjiretrieve.py - resolver referencji ("art. 415 kc" -> dokument), o ile istnieje⚠️
common/pdf_extract.pymapreload_existing_ids()odpytujace hostowana baze Neon Postgres (idempotencja pipeline'u LDH). Przy harveScie dla MateMatic uruchamiaj w trybie bez tego checku - nie wystawiaj danych kancelarii do Neon.
references/coverage-pl.md. Jest
-> uzyj kolektora. Nie ma / zablokowane -> luka, patrz tabela luk wyzej.runner.py sample na probe, potem pelny fetch_all();
zapis do lokalnego korpusu (SQLite + vector store, patrz
wewnetrzne KGLF MateMatic).fetch_updates().saos-orzecznictwo lub innego
konektora zapytan.saos-orzecznictwo), potem MCP.config.yaml). Uruchamianie kolektorow jako osobnych procesow i
uzywanie zebranych danych nie czyni powloki MCP MateMatic dzielem zaleznym -
spojne z insightem licencyjnym o MCP w otwartym ekosystemie MateMatic.sources/PL/ i status.yaml,
nie tekstowi README.references/coverage-pl.md to migawka 2026-05-19 - przy waznych
decyzjach odswiez (git pull + runner.py status).Creates, edits, and optimizes skills for Claude Code, including drafting, evaluating with test prompts, iterating on performance, and improving skill descriptions for better triggering accuracy.
npx claudepluginhub matematicsolutions/awesome-matematic-skills-pl --plugin legal-data-hunter-pl