01
Problem
こんな課題はありませんか?
感熱紙の薄れ・小さな文字・手書きが混在するレシートで、OCR 精度が伸び悩んでいませんか?
- 一般的な OCR では 80% 程度の精度
- 業界特有の用語(軽食コード等)を誤認識
- 同じ取引先を毎回別表記で出力
02
Solution
AI が解決する方法
WIM では Google Vision API を一次レイヤーに使い、業種別の語彙辞書(飲食 / 小売 / 医療 / 建設 等)で再判定する 2 段階処理を実装。
さらに過去の誤認識データを毎日学習しているため、運用が長くなるほど精度が向上します。3 ヶ月後には 99.x% の精度に到達します。
03
Details
機能詳細
## できること
– Google Vision API でテキスト検出
– 業種別の語彙辞書(飲食 / 小売 / 医療 等)で再判定
– 過去誤認識データから自動学習
– 信頼度スコア付きで結果を返却
– 未登録取引先は新規取引先候補として通知
04
I/O Samples
入出力サンプル
実際の入力データと、AI が生成する出力フォーマットの例です。
difficult_receipt.jpg
[Image: 感熱紙レシート (薄れあり)]
┌────────────────┐
│ ?ンダーズリ?ーフ │
│ 2026.02.13 │
│ 軽食 │
│ サンドイッチ × 1 │
│ 680 │
│ コーヒー × 1 │
│ 380 │
│ 計 1,060 │
│ T2345678901234 │
└────────────────┘
ocr_result.json
{
"vendor": "アンダーズツリーフ",
"vendor_canonical": "アンダーズツリーフ",
"vendor_match_confidence": 0.94,
"date": "2026-02-13",
"items": [
{"name": "サンドイッチ", "qty": 1, "price": 680},
{"name": "コーヒー", "qty": 1, "price": 380}
],
"subtotal": 1060,
"tax_rate": 0.08,
"category": "会議費",
"invoice_number": "T2345678901234",
"invoice_verified": true,
"overall_confidence": "HIGH"
}