From opendataloader-pdf
Wysokiej jakości konwerter PDF→JSON/Markdown dla AI - zachowuje reading order, strukturę tabel, headings. Użyj gdy użytkownik mówi "wysoka jakość PDF", "papers naukowe PDF", "tabele z PDF", "opendataloader", "PDF z skomplikowaną strukturą", albo gdy MarkItDown daje słaby output. Główny konwerter PDF→MD w pipeline Konwerter/ w Obsidian Vault.
How this skill is triggered — by the user, by Claude, or both
Slash command
/opendataloader-pdf:opendataloader-pdfThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
Java-based (Python wrapper) parser PDF najwyższej jakości dla AI. Benchmarki: NID (reading order), TEDS (tabele), MHS (headings). Używany w pipeline `Konwerter/` w vault.
Java-based (Python wrapper) parser PDF najwyższej jakości dla AI. Benchmarki: NID (reading order), TEDS (tabele), MHS (headings). Używany w pipeline Konwerter/ w vault.
python -m pip install --user opendataloader-pdf
Python 3.14, opendataloader-pdf 2.2.1. Wymaga Java 17+ (mamy Eclipse Adoptium JDK 17). CLI: python -m opendataloader_pdf albo opendataloader-pdf.exe ze Scripts/.
python -m opendataloader_pdf --input plik.pdf --output output/ --format md
python -m opendataloader_pdf \
--input "C:/Users/hp/Documents/Obsidian Vault/wszystko co wpada szybko/" \
--output "C:/Users/hp/Documents/Obsidian Vault/Konwerter/" \
--format md \
--recursive
--enrich-formula - wyciąga formuły LaTeX--enrich-picture-description - opis obrazów (wymaga --hybrid-mode full)--filter-hidden-text - wykrywa ukryty tekst (off by default, per-page rendering)import opendataloader_pdf
result = opendataloader_pdf.load("plik.pdf", output_format="markdown")
print(result.markdown)
| Narzędzie | |
|---|---|
| Prosty, tekst liniowy (blog, artykuł prasowy) | MarkItDown (szybsze) |
| Papers naukowe, raporty z tabelami | OpenDataLoader (jakość) |
| Dokumenty z 2-kolumnowym layoutem | OpenDataLoader (reading order) |
| Multi-page tabele | OpenDataLoader (TEDS) |
| Batch Konwerter/ (domyślnie) | OpenDataLoader |
Pipeline Konwerter (istnieje Python script w _vault-management/scripts/):
wszystko co wpada szybko/ lub dropowane bezpośrednioopendataloader-pdf --input <path> --format md --output Konwerter/type: source-pdf, tags: [pdf, zrodlo] - zgodnie z vault-rules.json → clippings.classification_rules.pdf_sourceKonwerter/ lub Attachments/c/Program Files/Eclipse Adoptium/jdk-17.0.10.7-hotspot/)--filter-hidden-text wyłącza parallelnpm run sync (dla kontrybutorów - nas nie dotyczy)Konwerter/, nie nadpisuj oryginalnych PDF.md już istnieje w output i checksumma PDF nie zmieniona → skipProvides UI/UX resources: 50+ styles, color palettes, font pairings, guidelines, charts for web/mobile across React, Next.js, Vue, Svelte, Tailwind, React Native, Flutter. Aids planning, building, reviewing interfaces.
Fetches up-to-date documentation from Context7 for libraries and frameworks like React, Next.js, Prisma. Use for setup questions, API references, and code examples.
npx claudepluginhub matematicsolutions/awesome-matematic-skills-pl --plugin opendataloader-pdf