2023年3月10日

AI-OCRとその実力

目次

Contents

こんにちは。弊社ではSHIORIというSaas製品を開発しています。
この製品の機能のひとつに、タブレットにスタイラスペンで手書きした文字をテキストデータに変換する機能があるのですが、変換にはAI-OCR機能を搭載しています。

このOCRについてどうなの?というところを、具体的に説明します。

OCRとは

そもそもOCRとは、Optical Character Recognition の頭文字から作成された言葉ですが、日本語では、光学文字認識と呼ばれています。
紙や画像データに含まれている手書きや印刷された”文字”をスキャナ等で読み取り、”文字”から”デジタルのテキストデータ”に変換する仕組みのことをいいます。

この技術の歴史は古く1930年頃には、国外において最初のアイデアが生まれ開発や特許の出願がなされています。1960年代からはコンピュータ技術の進歩に伴い実用化が進み、国内でも製品化されています。
1990年代にはOCR技術はPCに搭載されるようになり、個人でも手軽にOCRを利用できるようになりました。
2000年代以降にはOCR技術はAI技術と組み合わされ精度が飛躍的に向上し、また、技術進化によりスマートフォンなどでも手軽にOCRを利用できるようになりました。

OCRの技術は、時代とともに進化してきました。
現在では、高精度のOCR技術が普及し、OCRの利用はますます一般的になっています。

AI-OCR とは

近年のAI(人工知能)技術の発達によりOCRの精度も格段に向上しました。

旧来のOCRの仕組みでは、手書き文字については同じ文字でも十人十色で筆跡が異なるため、パターン化することが難しく苦手分野でした。
AIは、ディープラーニングやニューラルネットワークなどの技術を使用して、大量のデータからパターンを学習することができます。これにより、OCRが認識できなかった手書きの文字に対しても高い精度で特徴を掴むようになり文字認識できるようになりました。

このように、OCR技術にAI技術を組み合わせたものを AI-OCRと呼びます。

現在のOCR製品でAIを活用していないものは無いと思いますが、弊社のSHIORIでもAI-OCRを利用しています。

OCR導入のメリット

OCRを導入することでいろいろなメリットが存在します。

データ入力の効率化
社内システムなどへのデータ入力で文字入力する時間を削減することができます。これにより、作業時間の短縮や人的ミスの削減が期待できます。
また、データ入力を手で入力する場合によく起こるタイプミスなどを削減することもできます。

データの再利用
紙として保存されている情報から文字を検索することは非常に手間ですが、OCRによってデジタルのテキストデータに変換し保存されたデータは、探したい文字を全文から検索をする事も可能となり、必要なデータに簡単にアクセスできるようになります。大量の紙の束からひたすら探しだす事に比べて、デジタルで検索する場合には圧倒的な業務の効率化を図ることができます。
また、デジタルデータになることで自然言語処理(NLP)技術を利用し、重要なトピックや頻出パターンを抽出できるなど、機械的・統計的に分析が可能になります。

コスト削減
手作業による入力作業や文書の保管にかかるコストを削減することができます。
また、そもそもデータをデジタル化することにより、ロッカーなど物理的な保管スペースを大きく減らすことができます。
また、紙の使用量を減らすことは環境保護にもつながります。

OCR導入のデメリット

メリットだけではなくデメリットも存在しています。

読み取り精度の問題
対象とする文書が、手書きの文字や特殊なフォントを含む場合や特殊な業界用語を利用している場合に、読み取り精度が低下することがあります。また、OCRにかける書類そのものに傷・汚れがあるなどの質が悪い場合も同じです。読み取り精度の低下は、誤ったデータが作成されることに繋がるため、生成されたデータの確認作業やデータ補正作業などの運用手順が新しく必要になります。

システム導入コストの発生
OCRシステムを導入するためには、専門の機器やソフトウェアを購入する必要があります。また、OCRシステムをゼロから構築する場合には高性能なコンピュータシステムが必要になることがあり、メリットに挙げていたコスト削減との対比を考慮する必要があります。

さらに導入したOCRシステムを運用するためには、専門知識を持った人員が必要になります。トレーニングや、システムの保守管理に関する人員の確保が必要になります。

セキュリティの問題
OCRによって変換されたテキストデータは、デジタルデータとして保存されることになります。デジタル化されたテキストデータはコンピュータで利用可能になるため取り回しが良くなる一方、紙媒体に比べるとデータ流出のリスクは格段に高くなるため、データ保護とセキュリティについて考慮する必要があります。特に、個人情報や機密情報を含むデータをOCRで処理する場合は、今まで以上に強固なセキュリティ対策を講じる必要があります。

認識率について

OCRを導入するにあたり最も気になるのは、認識率ではないでしょうか。
実際、お客様からお問い合わせを受ける内容で最も多いのも認識率に関するお問い合わせです。
しかしながら、その回答として一様に何%です、と回答することが難しいのです。

その理由は、認識率は使用するOCRエンジンや画像の品質、文字の種類などによって異なります。
一般的に、フォントを利用した印刷文字の認識率よりも手書き文字の認識率の方が低くなる傾向がありますが、最近のAI-OCR技術の進歩により、手書き文字の認識率も非常に高い精度が実現されています。

ただし、完全に正確なOCR認識は時に難しい場合があり、文書の品質や文字の書き方によって認識率が大きく変わることがあります。

認識率を上げるためには

認識率を上げるためには以下のようなアプローチがあります。

スキャン品質を改善する
OCRにとって重要なのは高品質な文書や画像を読み取ることです。元文書が汚れていたりするとそもそも正しく読み取れません。スキャナの解像度を上げる、明るさとコントラストを調整する、書類の汚れを取り除く、などの方法があります。

読み取る項目を限定する
OCRは大量の文字を一度に読み取ることができますが、全てを一度に読み取るのではなく、例えば「かな氏名(ひらがなのみで構成)」「電話番号(数字のみで構成)」「都道府県(47種類のうちの一つ)」といったように読み取る項目を限定することにより認識率を向上させることが可能です。
製品によっては読み取る項目にヒントを付与することで認識率を向上させることが可能になる製品も存在します。

手動で修正する
OCRによって認識されなかった文字や読み取り結果が誤っているテキストデータを手動で修正することによって、正しいテキストデータを作成することができます。これは、認識率を上げるアプローチとは少し異なるかもしれませんが、最終的には認識結果を完全に正しいテキストデータにすることが可能です。

AI-OCRの課題

一番の課題は認識率かと思いますが、それ以外にもこのような課題があります。

多言語対応の問題
AI-OCRはシステム構築時に大量の訓練データを必要としている関係上、言語によって認識精度が著しく異なります。言語によっては全く認識できないこともあります。
この問題を解決するためには、各言語に最適化されたOCRエンジンを切り替えて利用する必要があります。

システムの導入や運用の問題
OCRシステムを導入するためには、システムの設計や導入、運用に関する技術的な問題を解決する必要があります。また、継続して運用していくにはシステムの保守やアップデートにも対応する必要があります。
この問題を解決するには、自社内に専門のチームを準備する必要があります。もしくは、Saas形式で提供されている製品を利用することで高度なシステム構築技術や運用については意識することはなくなります。

最後に

さて、弊社 SHIORI での実際の認識結果をご覧ください。

いかがでしょうか。
手書きの文章を認識してデジタルデータに変換できていることがわかると思います。
たとえば、コールセンターなどでお客様からいただいた生のお声を「SHIORI」に書き残すことで簡単にデータ化でき、VOC(Voice of Customer)分析などにご活用いただくことも可能になります。

弊社が提供するAI-OCR機能搭載の「SHIORI」には1ヶ月の無料トライアルの用意がございます。
紙での運用が残っている、OCRを利用してデジタル化したい、というお悩みをお持ちでしたらお気軽にご相談ください。

■タブレットお客様カルテSHIORI
https://www.saishunkansys.com/service/tablet-karte/

記事 : T.A

「タブレットお客様カルテSHIORI」の詳細はこちら