近年、クラウドインフラによる大量計算が可能になり、AIを用いた優れたOCRエンジンが発表されるようになりました。
加えて、RPAに代表される業務の自動化が活発で、複数の会社でOCRを用いた伝票処理の自動化ソリューションが発表されています。
OCRエンジンの組み合わせの最適化手法を用いた、複数のOCRエンジンによる、より高い正確性を持った伝票読み取りソリューションをご提供致します。
> パンフレットを見る(PDF)
●本製品は、UOCR機能とワークフロー承認機能による伝票読み取り業務を自動化する製品です。
●面倒な伝票入力作業を自動化することによって、人リソースの再配置を可能とします。
●複数のOCRエンジンを組み合わせて、読み取り項目の特性に合わせたエンジンを、コスト面、読み取り精度面から選定し読み取りを行います。
●独自OCRエンジンを有し、汎用のOCRエンジンでは読み取り困難な伝票に対しても、個別チューニングによって、読み取ることが可能です。他社製品に比べて(※当社比)、コスト面、読み取り精度面で優位性があります。
●APIやCSVファイルなど一通りのI/Fを提供し、様々はRPA製品と連携が可能です。
●OCRエンジンは、重量課金でご提供します。
【伝票振り分け】
伝票のフォーマットによって振り分けを行い、伝票フォーマット毎の読み取り箇所を設定します。
【伝票画像の加工】
伝票画像の傾きや歪み、拡縮、コントラスト調整を行い、均一な画像に変換します。
【OCR読み取り】
複数のOCRエンジンを用いて、正確性・コストの観点で最善の読み取り結果を得ます。
(例)商品名はGoogleOCR,商品コードはAzureOCR、補足はTegaki.ai、数量は独自OCRなど、最も識字率が高いOCRエンジンを組み合わせて読み取りを行います。
【読み取り結果確認】
OCRで読み取った結果を、画面で最終確認します。その際に読み取り結果の正確性を視認することができ、確認作業は、不正確と判定した読み取り結果のみに注力することができます。
【読み取り結果出力】
読み取った結果をCSV形式などで、出力します。
●独自OCRエンジンは、手書きの英数記号に特化し、対象の伝票に記載されている字体に対して、個別のチューニング(学習)を行います。
●その為、学習を行った伝票に記載している字体および類似の字体は、癖のある字体でも識字することが可能です。
●ただし、伝票毎に字体を収集して学習を行う為、ある程度の導入期間を要します。
●他方で、ベンダー提供のOCRエンジンで高い識字率を得られる場合は、格段の導入期間は不要です。
【手書き文字OCR製品の比較】
ベンダー | A社 | T社 | 独自OCR | 補足 |
---|---|---|---|---|
字体学習の方法 | 収集した大量の字体を学習し、一元したナレッジとして管理する。 | 伝票毎に収集した字体を学習し、伝票毎に独立したナレッジとして管理する。 | ||
適正 | 記入者が不特定多数。 (市役所に提出する手書き伝票など) |
記入者が固定少数である場合を対象とする。(取引先の担当者が固定されているなど) | ||
対象字形 | 日本語、英数記号 印字、手書き文字 |
英数記号 手書き文字 |
印字文字でも字形が崩れている場合は、独自OCRを適用する場合があります。 | |
識字に関する特徴 | 汎用性維持の為、印字字体に近しい字体である必要がある。 | 全く別の字体でも識字することが可能。 例)字体『1』は、『2』であると学習することが可能。 |
||
識字不可である場合でも、個別のチューニングは実施されない。 | 識字不可の場合、識字されるまで学習を実施。 | |||
導入期間 | 即時利用が可能 | 字体の収集および学習期間を要する。 (通常、1ヶ月〜3ヶ月) |
本OCRソリューションは、項目毎に、他社OCRとハイブリット構成とし、精度およびコストで選定し組み合わせて使用します。 |
●弊社独自OCRエンジンは、英数記号に特化しています。
●英数記号に特化している理由は、伝票において、英数記号項目は、伝票番号や商品コード、金額など、誤りを許容できない項目と考えているためで、一方、日本語項目(商品名や備考など)は、多少の誤植があっても許容できると考えています。
【他社OCRが不得意とする文字例でも独自OCRエンジンでは読み取りが可能です】
機能分類 | 機能 | 説明 | 備考 |
---|---|---|---|
共通機能 | ログイン | 利用者のログイン管理を行います。 | ADへのSSO認証も可能です。 |
権限管理 | 権限管理 | 任意の権限を管理することができます。メニュー表示可否、画面遷移可否を権限毎に設定することが可能です。 | デフォルトで、システム管理者、承認者、利用者を登録します。 |
ワークフロー管理 | ワークフロー | 伝票の読み取り、修正、承認などのワークフローステータスを設定します。 | |
ユーザ管理 | ユーザ管理 | 任意のユーザを管理することができます。ユーザー毎に権限を設定することが可能です。 | |
サイト管理 | サイト管理 | 複数のサイトを管理することができます。ユーザーはどのサイトが利用可能か設定可能です。 | サイトを部署単位で設定することによって、部署単位での可視制御が可能です。 |
読み取り伝票 | 伝票読み取り | 指定場所に置かれたファイルを順次、読み取り処理を行います。 読み取り処理では、 ●伝票体裁による振り分け ●画像加工 ●指定場所の文字認識 を行います。 |
画像加工は、 ●コントラストの均一化 ●拡縮補正 ●歪み補正 を行います。 |
読取伝票編集 | FAXやスキャナから読み込み、文字認識を行った結果を確認、訂正する機能です。 | 辞書変換、セマンティックチェック機能を有します。 例)数字エリア 読取結果:56G 補正後:566 |
|
承認伝票 | 伝票承認 | 訂正済伝票を承認者が承認を行います。AI学習によって自動承認を行うことが可能です。 自動承認で行われた判定内容は証跡として保持し、事後に参照可能です。 |
AI学習は、利用者、対象伝票属性(伝票提出元など)、伝票毎認識率で、承認・否認・保留を制御します。 |
伝票一覧 | 伝票閲覧 | 登録されているすべての伝票を閲覧します。 ステータスの絞り込みによって、連携済・未実施等の状況把握に用います。 |
連携ファイル出力前まで伝票の訂正が可能です。 |