コラム

2020.06.05AI-OCR

AI-OCRの文字認識精度はここまですごい!

ペーパーレス化は組織の生産性向上だけでなく、森林保護やCO2削減など環境保護にも貢献することから、今日のビジネスを生きる企業にとって喫緊の課題だと言えます。しかしならが、これまで多くの企業がペーパーレス化に取り組んだものの、十分な成果を上げていません。なぜなら「各企業の試みが組織内の閉じられたもの」であることが多かったからです。

 

例えば、取引先と見積書や請求書のやり取りをする際に、取引相手が紙媒体で社判を押印したものしか受け付けなかったら?紙をなくすことは当然できません。いくら企業がペーパーレス化を促進しても、他社との関わりの中で紙を完全に排除することが難しいため、結局は紙の管理に追われることになります。

 

ただし、AI-OCRによってそんな現実を変えることができます。取引先と紙媒体の文書をやりとりしても、それを正確にスキャンできればペーパーレス化は今よりもずっと促進するでしょう。そこで本記事では、文字認識精度が年々向上している、AI-OCRのすごいところをご紹介します。

AI-OCRについておさらい

AI-OCR、それはAI(Artificial Intelligence/人工知能)を搭載したOCR(Optical Character Reader/光学的文字認識)システムの総称です。また、一口にAIと言っても様々な技術があります。昨今一般的とされているのが「機械学習」と「深層学習」です。

機械学習(マシンラーニング)

機械学習(マシンラーニング)

膨大なデータに対して着目すべきポイントを人間が指定し、コンピューターにそのポイントについて繰り返し学習させる技術です。例えば大量の犬の画像データに「これは犬だ」というポイントを付与し、それをコンピューターに読み込ませます。するとコンピューターは次第に、ポイントが付与されていない画像データを見て「これは犬だ」と判断できるようになります。

深層学習(ディープラーニング)

機械学習の発展形であり、コンピューター自らがデータの中から着目すべきポイントを見つけ出し、自律的に学習を繰り返します。例えばコンピューターに犬や猫といった概念が存在しない場合でも、それの画像データを繰り返し学習させることで自ら犬と猫の判別をするようになります。

 

これらのAI技術を搭載したOCRがなぜ高い精度を発揮するのか?AIは認識技術において人間の能力を凌駕しており、膨大なデータベースの中から瞬時に適合するデータを発見できる処理能力と、自律的に思考することで過去に例がないデータに関してもそれに類似したデータを抽出したり、読み込んだデータの特徴を整理することで適切な判断が行えるようになるからです。

AI-OCRのここがすごい

それでは、AI-OCRの何がすごいのか?気になる点を明らかにしていきます。

手書き文字の識別率がグンと向上した

紙媒体で扱われる文書の中には、手書きで作成してものや、手書きのメモを加えたものなども存在します。従来のOCRでは、手書き文字の識別率が低く実用的ではなかった問題があります。

 

例えば「工具」という手書き文字を読み取った際に、漢字の「工」ではなくカタカナの「エ」と読み取ったり、「具」を間違えて「貝」と認識してしまったりするような現象が多々発生します。

 

そもそもOCRはそれに搭載されたロジックに従い、決められたパターンでしか文字を識別できません。結果として読み取ってデジタル化した文書を再度確認する必要があり、そこに多くの手間が割かれていました。

 

一方、手書き文字の識別を得意とするAI-OCRはAI技術の中でも深層学習を搭載しているものが多く、前後の文字や文面から正確な文字を読み取ることができます。また、多少汚い手書き文字であっても高精度に読み取ることが可能で修正の手間が削減されます。

 

文字の識別を間違えたとしても、それを間違いえだと指定することで自ら学習し、より識別率を向上していくことが可能です。

異なるフォーマットの帳票にも対応可能

紙媒体の文書をOCRによってデジタル化するにあたり、事前に読み取り位置や項目などを細かく定義する必要があります。多くのOCRは特定のフォーマットにしか対応していないので、契約書や納品書、請求書などフォーマットが異なると上手に読み取ってくれないのが難点です。

 

対してAI-OCRは、AIが読み取り位置や記載項目などを自動的に識別してスキャンします。そのため、OCRにわざわざフォーマットを登録せずとも、原本に近いフォーマットで紙文書をデジタル化できます。<br>最近では組織内で保管する文書料が増え続けることで様々な問題が発生しています。フォーマットも多様化し、紙文書まま保管を続けるのは非効率的です。

RPAとの連携による高度な業務自動化

生産性向上の実現や、リモートワーク環境における業務効率化のために欠かせないのが「仕事のシンプル化」です。複雑な作業を簡素にすれば生産性は当然アップしますし、遠隔コミュニケーションが基本のリモートワーク環境でも業務効率化が促進されます。

 

そのために必要なのが、AI-OCRとRPA(Robotic Process Automation/ロボティック・プロセス・オートメーション)のコラボレーションです。RPAとはパソコン上の作業を自動化するロボットソフトウェアで、ユーザーが定義したプログラムに従ってデータ等を自動的に処理します。

 

AI-OCRとRPAを連携すれば、AI-OCRにてデジタル化した文書を自動的に特定のフォルダに保管したり、クラウドストレージへアップしたり、さらに関係者全員にメールで共有したりと様々な活用方法があります。紙文書をスキャンした際にCSVファイルとして出力し、業務システムへのデータ転記を自動的に実施することも可能です。

柔軟なAI-OCRを実現した「AIRead」

「AIRead(エーアイ・リード)」はAI技術を搭載したOCRシステムであり、スタンドアロン型、サーバー型などで利用できるAI-OCRソフトウェアです。ここでは「AIRead」の特徴についてご紹介します。

特徴1. 活字の読み取り

プリンタ等で印刷された活字を読み取り、データ化します。画像にある文字を全文スキャンする形で読み取ります。読取精度:~99%

特徴2. 手書き文字の読み取り

手書きで書かれた文字を読み取り、データ化します。実際の文字を学習させることで、読取精度を向上させることが可能です。読取精度:英字、数字、記号~99%<br>平仮名、カタカナ、漢字 88.2%※(2019/4/1現在)

特徴3. データ自動抽出

異なるフォーマットであっても、キーワードを指定することで、そのキーワードに関連するデータを取得することができます。データの位置にずれがある書類や、複数フォーマットある書類に対応できます。事前の読取位置(座標)の指定は不要です。

特徴4. データ閲覧/編集

読取結果のデータをWebブラウザから閲覧・編集可能です。オプションで閲覧・編集画面設計機能(AIRead Screen Designer)を提供します。

特徴5. 手書き文字の学習

誤判定した文字は、その文字画像と正解データを教師データとして学習させることで精度が向上します。AIRead Train Studio HW(GUI)で直感的に教師データを追加学習させることができます。※手書き画像のみの対応となります。自動学習を実現するには、閲覧・編集画面と連携し、NG画像と正解データの取得ができる前提です。

特徴6. 活字の学習

書類に頻出する単語(業界専門用語・製品名など)や書類に使用されているフォントは、AIReadに学習させることで精度が向上します。AIRead Train Studio(GUI)で頻出単語やフォントデータを追加学習させることができます。※本機能により単語を学習させることで、別の単語の読取精度が落ちる可能性があります。本機能は手動での学習のみとなります。

特徴7. RPA連携による業務効率化

AI OCR(AIRead)とRPA(WinActor等のツール)を連携させることで、さらなる業務効率化を実現できます。

特徴8. データ連携

AIReadをバッチ形式で利用する場合、AIRead ETL Optionを活用することでより効率的な実装が可能です。

 

以上のように、「AIRead」はAI-OCRとして柔軟かつ高度な機能を提供しています。AI-OCRを導入される際は是非ご検討ください。

株式会社無限やソリューションなどへの資料請求・お問い合わせは、お気軽にご連絡ください。

PAGETOP