コラム

2021.04.23AI-OCR

スキャンした文書をワードに変換するOCRツールをご紹介

OCRツールとは 

PDFや画像で保存したデータをワードなどで利用できるテキストデータに変換するためには、OCRツールが必要になります。

 

OCRツールとは、簡単にいえば紙媒体等からスキャンした資料や画像をデジタル情報へと変換する技術を用いたツールのことです。このツールにより、たとえば契約書をスキャンし、ワードへと変換して保存・編集することが可能となります。 

 

スキャンした情報をテキストデータに変換する際は、スキャンした資料の文字認識が必要となります。そこで用いられるのがOCROptical Character Recognition」(光学文字認識)です。 

人が情報をワードに落とし込む際に行っている、文字を認識する、その文字を打ち込む、という作業を自動的にやってくれる、といえばわかりやすいと思います。 

 

このOCRという技術はすでにパスポートや請求書の読み取りといったさまざまな場面でも使われています。各企業におけるIT化の促進が進むにつれ、OCRツールの需要も高まっており、それに応えるようにさまざまなツールが提供されています。 

 

スキャンした文書をワードに変換するOCRツール 

文書をスキャンしてデジタルデータに変換し、ワードなどで利用できるようにするOCRツールの概要を簡単に説明しましたが、導入は容易で、手軽で簡単に利用できるOCRツールも多くあります。

とはいえ、その利用方法や必要な機器、利用料金などが気になるかもしれません。 

 

そこで、代表的なOCRツールを5つ具体的に紹介し、詳しく説明していきます。 

 

HiPDF 

https://www.hipdf.com/jp/ocr 

特長としては、スキャンしたPDF文書や画像、ファックス、スクリーンショット、電子ブックを、編集可能なWordExcelPPT文書に変換することが可能であることが挙げられ、OCRツールに求められる基本的な機能を揃えています。加えてファイルの転送にあたってはセキリュティで保護されていることも、特にビジネスの場面では魅力的です。

 

無料で利用できる試用プランと、枚数やサイズに制限のあるクラウドベースオンリーのHiPDF Pro、デスクトップにダウンロードしても使用できるHiPDF Pro Plusがあり、用途や頻度に応じて選択できます。 

 

HiPDF HiPDF Pro Plusを比較すると、HiPDFは月額675円もしくは年間一括で5,400円、最大ファイルサイズが100MBまでで2,000ページ以下となっていますが、HiPDF Pro Plusは価格が月額889円もしくは年間一括が6,899円で利用ファイルサイズやページ数は無制限です。 

 

PDFや画像データは意外にファイルサイズが大きくなることありますし、価格差もそこまで大きくないため、おすすめは制限なしのHiPDF Pro Plus です。 

 

PDFelement 

https://pdf.wondershare.jp/ 

こちらはOCRに特化したツールというよりは、PDFを編集するための機能が豊富も揃っており、その中にOCRも入っているといった形です。 

 

利用用途にあわせて標準版とプロ版からプランを選択可能です。

 

双方ともに非常に充実したPDF編集機能がありますが、OCR機能はプロ版にしかつかないため、紙媒体をスキャンしてさらにワードやエクセルで保存・編集したい場合にはプロ版が必須となります。学生や教職員向けの特別プランが用意されていることもあり、一般ビジネスユーザーよりは、教育・研究関係者におすすめといえるでしょう。 

 

また、期間に制約のない永続プランもあります。料金はOCRがついているPDF element プロ版で1年間プランが7,280円、永続ライセンスが9,980円となっています。学生・教職員向けのプランの場合1年間プランが5,580円、永続ライセンスが7,580円です。 

 

Google ドライブ 

https://www.google.com/intl/ja_jp/drive/ 

Googleドライブに保存されたPDFや画像データを右クリックし、「アプリで開く」→「Googleドキュメント」を選択すると、データ内の文字を認識してGoogleドキュメントに文字起こししてくれます。 

 

手軽さの割に精度が非常に高い上、無料である、Googleドライブ内にあるデータなら即座にOCRでドキュメント化できる、ドキュメント化すればドライブ内で簡単に検索できる、といった多数のメリットがあります。またGmailといった他のサービスと共有ではありますが、無料でも15GBまでクラウド保存できます。 

 

本格的にビジネス利用するのであれば、Google Workspaceといったサービスも用意されており、Googleが提供する他のサービスと組み合わせた拡張性の高さも魅力です。まずはOCRがどれくらい便利なのかを確認するために、Googleドライブを試してみるのもいいかもしれません。 

 

Light PDF 

https://lightpdf.com/jp/ 

こちらは無料で利用可能なPDF編集を主としたOCRツールです。データをPDF化する、PDFをワード等に変換するといったことが可能ですが、OCRを用いてJPEG等の画像データをテキストデータにすることもできます。 

 

無料のプランであるOCR言語認識がひとつの言語までしか対応していなかったり、テキストデータへの変換のみでワードには直接変換できかったりなどの制約もありますが、文字起こしを試してみたいという場合にはおすすめです。 

 

不自由を感じた際には有料プランであるOCR VIPへと切り替えることも可能です。OCR VIPPDFや画像をWordExcelPPTTXTPDFRTF形式に高精度で変換できます。さらに、複数の言語に対応します。

 

なおOCROCR VIPともにアップロードできるファイルサイズは30 MBまでです。期間ではなく枚数で料金が決まっており、1080/100ページ、2680/300ページ、6480/1000ページのいずれかから選択します。 

 

Office Lens 

https://play.google.com/store/apps/details?id=com.microsoft.office.officelens&hl=ja&gl=US 

 

こちらはMicrosoftが提供するアプリですが、windows版は202111日以降ダウンロードできなくなっており、iOS  Microsoft Lens または Android  Microsoft Lens のみ利用可となっています。 

 

このアプリの強みは、スマートフォンやタブレットといったモバイルデバイスにダウンロードすることで、たとえばホワイトボードに記入された会議の内容や講義の板書等を写真撮影して、PDFやワードに変換して保存しておける点です。

 

つまり、単にOCRを用いてデータを変換するだけでなく、スマホやタブレットといったモバイル端末をスキャナーとして利用できるようになるのです。この機能は名刺の管理などにも便利に応用できるでしょう。

 

こちらもGoogleと同じく、Microsoft OneDriveといった拡張性のあるサービスとの連携が可能です。    

 

まとめ 

OCRツールはPDFや画像データを、ワードなどのデジタルデータに変換し、業務の効率化を図るツールです。契約書や稟議書のフォーマットや文言を一つひとつ再作成したり、ひな型を残したりしている企業も多いと思います。

 

今回ご紹介したツールを使えば、そういった煩わしさから少しでも開放されるはずです。用途や場面に応じてぜひ活用してみてください。 

 

また、今回ご紹介した内容は、スキャンしたデータをワードへ変換するものが中心でしたが、特にビジネスの場面ではスキャンしたデータを、ワードではなく汎用性の高いエクセルや各種システムへ入力したいといったニーズもあるでしょう。 

 

こういったニーズには対しては、入力業務の自動化をフォローする無限のAI入力ソリューションの利用がおすすめです。AIを用いた高い認識能力・学習機能があり、利便性も高いため業務効率の改善に貢献します。 

https://www.mugen-corp.jp/solution/ai-input/ 

株式会社無限やソリューションなどへの資料請求・お問い合わせは、お気軽にご連絡ください。

PAGETOP