jp

数据解决方案

请输入姓名

携帯電話番号が無効です

連絡先を入力してください

会社名を入力してください

有効な仕事用電子メールを入力してください。

ご希望のデータについて入力してください

送信完了しました! ご協力ありがとうございました。

填写格式错误请重新填写

確認する

5文字以下、または数字のみでの入力は無効です。

https://www.datatang.co.jp

データアノテーションプラットフォームでOCR効率を向上しよう

作者:Datatang 公開日:2024-09-12

紙幣やその他の紙類は、私たちの日常生活のいたるところで目にすることができます。大切に保管しなければ、紛失や破損を招き、自分に難題をもたらすこともあります。情報化時代、請求書や帳票など紙資料の管理方法は日進月歩。現在では電子管理が主流となっています。

かつては、請求書や帳票など紙資料の情報化は完全に手入力に頼っており、非効率でミスが多いだけでなく、膨大な人手と資材が必要でした。また、手作業によるデータ入力はAIアルゴリズムには適用できませんでした。

保険業界を例にとってみましょう。過去10年間、日本の保険業界は安定した成長を見せました。2023年には、業界全体の年間総収入は約40兆円に達しました。成長率は年間平均で約2%前後を維持しており、主に高齢化社会の進展と医療・介護保険の需要増加が要因です。テクノロジーの導入やデジタル化も進み、効率的な運営と顧客サービスの向上が実現しました。

OCR請求書認識システムでは、写真を撮ってスキャンするだけで、システムが自動的に保険書類のデータを収集します。弊社は効率的な保険文書処理ソリューション、Shujiajia Proデータラベリングプラットフォームを提供します。これは、OCR手形認識システムのコア機能構築を完成させるために使用されます。OCR手形認識システムは主にOCR事前識別、手作業による管理、データ出力、チェックという4つのモジュールを含みます。これらは「human in the loop」という経路を形成しています。

Shujiajia Proは、弊社が長年の経験に基づいて開発したデータ処理プラットフォームです。長年の実際の生産経験によって磨かれた様々なツール、データラベリング品質管理プロセス、データ処理、オンライン事前識別機能を網羅しています。

Shujiajia Pro: データアノテーションのエキスパート

OCR認識エンジンをベースとするShujiajia Proは、OCR事前識別サービス(行レベル検出+テキスト転記)をサポートしています。事前識別の精度は90%に達します(明瞭なフォント、大きな角度の傾きがない場合)。

データセットが継続的に更新され、アルゴリズムも反復されるため、アルゴリズムの性能は向上し続けます。Shujiajia Proは、お客様独自の事前識別エンジンに柔軟に切り替えることができます。本システムとお客様の事前識別エンジンは、プラグインによって軽く結合されています。お客様はプラグインの仕様に従ってDockerイメージを開発し、システムにアップロードするだけです。

ケース1:付加価値税の請求書

事前識別処理後、結果はOCRテンプレートでアノテーターに表示されます。アノテーターは、事前認識システムによるエラーを修正し、品質検査に提出します。OCR事前認識エンジンにより、ラベリング効率は約30%向上します。

ケース2:外来診療費の領収書

弊社のOCR事前識別技術は、請求書、外来料金領収書、タクシー請求書、保険書類、病院記録、自動車保険請求書など、複数の請求書フォームを処理することができます。

事前識別処理と手作業によるエラー修正を経て、データは品質検査員に提出されます。品質検査官は、データ全体の画像エラーとラベルレベルのエラーを指摘し、エラーの理由を説明し、修復のために注釈者にデータを返します。フレームエラー、ラベルオブジェクトが一致しない、ラベルと属性の間違いなど、多くのエラータイプがシステムに組み込まれています。また、プロジェクトマネージャがプロジェクトに応じてエラータイプをカスタマイズすることも可能です。

結果データは「json」形式で出力されます。例えば、Pascal VOC (.xml)、Labelme (.json)などの出力データをデータプラットフォームにインポートしたり、アルゴリズム反復のための標準AIデータセットを形成することができます。

まとめ
弊社は、Shujiajia Proプラットフォームのビジネス展開を通じて、完全かつ効率的な請求管理ソリューションを提供し、現地配置を通じて顧客データのプライバシーとセキュリティを確保します。

データサービスが必要な場合は、お気軽にお問い合わせください: [email protected]