ペーパーレス化

AIがOCRを急速に進化させる? AI OCRが求められる理由とは

掲載日:2023/07/25

AIがOCRを急速に進化させる? AI OCRが求められる理由とは

DX化が進まない企業においてしばしば問題となるのが紙書類の管理だ。早急にOCRでデータ化したいところだが、フォーマット定義や不正確な読み取りの修正に膨大な手間をかける必要がある。このような負担を削減してくれるのが、従来のOCRよりもはるかに正確な読み取りを期待できるAI OCRだ。

OCRの歴史とAI OCR誕生の衝撃

AI OCRとは、読んで字のごとくAI技術を活用したOCRのことで、ICT市場のリサーチを専門とする株式会社MM総研が2019年に発表した調査によると、国内法人の9.6%が「導入済み」と回答している注目技術だ。同調査によると、未導入企業の51.9%が「利用に関心がある」と回答しており、2023年現在はさらに浸透が広がっているものと考えられる。

そもそもOCRとは、紙などに印刷された文字あるいは手書き文字を画像認識し、コンピューターで利用可能なデジタル文字コードに変換する技術だ。領収書や名刺をデータ化する際、使用することが多いだろう。人間が紙に記載された内容をキーボードなどで入力する場合に比べ、OCRははるかに大量のデータを高速に処理できるというのがメリットである。しかし、手書き文字の認識が不正確だったり、書類ごとに情報の取捨選択が必要になったりと、最終的にデータを修正する手間が発生するというデメリットも存在した。

OCRは一般の企業での活用が始まった1980年代から技術的な進歩が続いたものの、根本的な部分で先に述べたデメリットを解消することは困難だった。そんな中、2012年にILSVRC(コンピューターによる画像認識技術の精度を競う世界的大会)でトロント大学の研究チームがディープラーニングを用いたAI画像認識ソフトを発表し、圧倒的な精度の高さで優勝。これにより、OCRでもAI技術を活用することへの注目が高まって、よりデメリットの少ないAI OCRの普及が進むこととなった。

AI OCRの特徴とは

AI OCR最大の特徴は、旧来のOCRに比べて極めて文字の認識精度が高いことである。これは、AI OCRディープラーニングによって一度間違えた文字のデータを学習し、次回以降の認識率を向上することが可能なためだ。なお、前述したILSVRCで認識精度の優劣を競う際のテストに人間が挑戦した場合は5%前後の誤認率となるのだが、2016年のテストではAIが3.6%前後という誤認率を記録している。すなわち、AI OCRに使われるAIは既に人間の文字認識能力を超えていると言えるわけだ。

また、AI OCRは多様な記帳内容の読み取りに対応できる点も特徴である。旧来のOCRは、請求書や発注書といった取引企業ごとに形式が異なる書面を画像認識する際、スムーズに処理するためにはあらかじめソフトにそれぞれの大まかな記帳内容を入力する必要があった。対してAI OCRはこのような事前に入力すべき内容を自動で認識・判断してくれるため、作業を大幅に削減できるというメリットがある。

なお、ひとくちに多様な記帳内容に対応が可能であると言っても、実際のAI OCRソフトは帳票の種類に応じて大きく以下の3種類に分けられる。

汎用×定型フォーマット型

領収書や名刺など読み取る記帳の内容は問わないものの、それぞれの記帳フォーマットを事前に定義する必要があるソフトは「汎用×定型フォーマット型」に分類される。手動でフォーマットを定義するため、どの記帳のどの位置の情報を取捨選択すべきかを正確に設定でき、データの抽出精度を高めることが可能な点がメリットだ。一方、フォーマットごとに事前定義の手間がかかる点はデメリットである。

汎用×非定型フォーマット型

汎用×定型フォーマット型と異なり、記帳においてどの情報を取捨選択するかまで、AIが学習し判断するソフトが分類されるのは「汎用×非定型フォーマット型」だ。事前定義の手間がかからないものの、新規フォーマットの学習が進むまで抽出の精度が低いという点はデメリットである。

業務特化×非定型フォーマット型

特定の業務における記帳について、利用し始めた段階から高い精度でデータを抽出できるソフトは「業務特化×非定型フォーマット型」。事前にAIへさまざまな形式のフォーマットを学習させておくことにより、ビジネスで使用する一般的な書類であれば利用開始時から高い精度でデータを抽出が可能だ。

AI OCRの選定ポイント

実際にAI OCRを導入する際に最も注目するべきは、取り扱う業務に対する読み取り精度である。先に述べた3分類との相性に加え、手書きの文字を扱うのか、どの言語の文字が頻出するのか、正確な読み取り作業に対しどれくらいの時間を許容できるのかなどのポイントを元に製品の特徴を見極めて選定することが重要だ。

また、AI OCRには、会計ソフトやRPAソフトといった他のソフトと連携が可能な製品も多数存在する。読み取ったデータを処理し、他の業務で使用するという流れで自動化の実現を目指す場合は、このようなほかのソフトとの連携が欠かせない。

AI OCRの導入事例

実際にAI OCRを導入し業務効率の向上を実現させた例は、既に何件も報告されている。例えばとあるエネルギー系企業では、紙帳票の内容を担当者が手入力していたデータ管理にAI OCRを導入したことで、従来は1件あたり5分かかっていた作業を30秒まで削減したという。

また、とある人材コンサルティング企業では、AI OCRの導入によりデータ入力の担当者が大幅に削減できたうえ、在宅での対応も可能になった。同社ではさらに業務での活用を最適化できるよう、顧客が情報を書き込む申込用紙に「AI OCR専用フォーマット」を用意し、これを利用した場合は割引を設けることにした。これにより読み取りの正確性を向上しただけではなく、顧客からの高評価を得られたという。

業務における高度な自動化やDXを実現するうえで、目視できる紙の文字情報をデータ化することは避けて通れない課題である。コロナ禍以降の急速に変化するビジネスに対応するため、AI OCRには早急に目を向けておきたい。