From shinkoku
Extracts structured data from Japanese receipt, bill, and furusato nozei proof images/PDFs via OCR, PDF text extraction, and dual-agent validation.
How this skill is triggered — by the user, by Claude, or both
Slash command
/shinkoku:reading-receiptThe summary Claude sees in its skill listing — used to decide when to auto-load this skill
レシート・領収書・ふるさと納税受領証明書の画像を読み取り、構造化データとして返すスキル。
レシート・領収書・ふるさと納税受領証明書の画像を読み取り、構造化データとして返すスキル。
ファイルが PDF(.pdf)の場合、画像 OCR の前にテキスト抽出を試みる。
shinkoku pdf extract-text --file-path <path> を実行するshinkoku pdf to-image --file-path <path> --output-dir <dir> で PNG に変換し、以下の画像読み取りフローに進む精度を高めるため、同じ画像を2つの独立したコンテキストで並列に読み取り、結果を照合する。
2つの独立した読み取りを実行する: サブエージェントが使える環境では、2つのサブエージェントを並列で起動し、それぞれ独立に画像を読み取る。 各サブエージェントには以下の「基本ルール」と「出力フォーマット」をプロンプトとして渡し、画像ファイルパスを指定する。
結果照合: 両方の読み取り結果から主要フィールド(金額等)を比較する。
一致の場合: そのまま採用。「2つの独立した読み取りで結果が一致しました」と報告する。
不一致の場合: ユーザーに元画像パスと両方の結果を提示し、正しい方を選択してもらう:
サブエージェントが利用できない環境では、以下の手順で読み取る:
⚠ デュアル検証が利用できないため、必ずユーザーに目視確認を依頼してください。
画像を読み取り、以下の形式で返す:
---RECEIPT_DATA---
date: YYYY-MM-DD
vendor: 店舗名
total_amount: 金額(int)
tax_included: true/false
items:
- name: 品目名
amount: 金額(int)
quantity: 数量(int)
---END---
画像を読み取り、以下の形式で返す:
---FURUSATO_RECEIPT_DATA---
municipality_name: 自治体名(市区町村名)
prefecture: 都道府県名
amount: 寄附金額(int)
date: YYYY-MM-DD
receipt_number: 受領証明書番号(記載がなければ UNKNOWN)
---END---
複数のファイルパスが指示された場合、または Glob パターンでファイル一覧を取得した場合:
## file1.jpg
---RECEIPT_DATA---
...
---END---
## file2.jpg
---RECEIPT_DATA---
...
---END---
npx claudepluginhub kazukinagata/shinkoku --plugin shinkokuExtracts structured data from Japanese invoice images/PDFs using OCR, dual verification, and PDF text extraction. Outputs vendor, amounts, date, items in fixed format.
Extract invoice data from images or text, classify into categories, and generate a categorized Excel expense report.
Parses financial statement PDFs (checking, savings, credit card, brokerage, 401k, HSA, mortgage, tax form) into normalized JSON with dates, balances, and transactions.