OCRの歴史
OCR(光学的文字認識)の歴史は意外に古く、1920年代初頭から世界で研究・技術開発が行われてきました。現在では、文章の電子化や業務データの管理、文字検査など、幅広い分野で活用されているOCRですが、その基礎になる技術は1928年にオーストラリアで数字を読み取るOCR、翌1929年にアメリカで数字とアルファベットを読み取るOCRの特許が出願されたのがはじまりです。
1950年代~第1世代OCR
1950年代に入ると、読み取り・文字識別だけではなく、コンピューターへデータ入力を行う研究が本格化。1953年に特許を取得した「Gismo」は、単純な文字マッチングではなく、画像解析を行うことで、いくつかのフォントを認識できるように進化。そして1960年頃~1965年頃までの第1世代OCRは、OCR用に特別なフォントを使用することで、文字認識の正確性を高める方向で開発が進みます。
1965年代~ 第2世代・第3世代OCR
1965年頃~1970年代中盤の第2世代OCRは、OCR用フォントではない通常の印刷文字や手書き文字の認識ができるようになります。ただ、当時の読み取りは、数字や記号などの限定的なものでした。1970年代後半~1980年代まで研究が行われた第3世代OCRは、手書き文字や低品質印刷文字の認識向上および低コスト化が進みましたが、まだ主流は文字の間隔やフォントに制限のある単純なものでした。そして1980年中盤以降は、ハードウェアの価格も下がり、パッケージソフトも登場したことでOCRが一般化します。
- 日本におけるOCR開発
- 日本のOCR開発に目を移すと、1968年7月に東芝が国産初となるOCRを製品化。この製品開発の背景には、1968年から導入された郵便番号制度が大きく関わっていると言われています。郵便番号の読み取りと自動仕分けのために国産OCRの必要性に迫られ、東芝は「TR-3」と「TR-4」郵便区分機と呼ばれるOCRを開発しています。これが国産初のOCR製品です。
現在のOCR
1990年代以降は、OCRの小型化が進み、OCRソフトウェアの単体販売も一般化します。そして2010年代に入ると、スマートフォンやタブレット端末と連動した小型のOCR端末、さらにスマートフォンのカメラを使うOCRアプリも登場します。高速インターネットやクラウドサービスが一気に普及し、現在ではパソコンからオンラインで利用できるOCRサービスも増えています。さらにAI技術を活用したAI-OCRサービスも比較的安価に利用でき、企業だけではなく、個人向けサービスへと広がりを見せています。
OCRの今後
OCRの発展により、人間にしかできなかった“目視で文字を確認し、判別する”という業務の機械化が可能になりました。また近年では、AIとOCRをかけ合わせた「人工知能搭載型OCR」や「AI-OCR」という言葉がトレンドになっています。AIを活用した文字認識の学習により、精度が向上し、現在99%以上の認識精度を誇る製品も登場しています。さらに手書き文字の認識精度も上がり、幅広い用途での実用化が進んでいます。
OCRを活用することで、書類・紙業務の負荷が大幅に削減できます。これは契約・申請書類、請求書・見積書などのバックオフィスに限らず、たとえば部品や製品の入出庫・在庫管理など、幅広い業務で活用されています。現在、多くの場面で印刷した書類、手書きのデータなどがありますが、すべてを人の手によって管理しています。これらをOCRで自動化すれば、業務効率化が可能になり、本当に人が必要な場所に人員を割り振ることができます。
また、アナログ処理に比べ、圧倒的に入力ミスが少ないデジタル管理であれば二重チェックといった手間からも解放されます。無駄な資料の保管場所も不要になり、デジタルならデータの管理や検索も容易になります。このように企業にとってOCRの導入は、今後大きな転機になっていく可能性を秘めています。そこで重要なのが、AIやディープラーニングといった新技術とOCRエンジンの開発、さらにRPA(Robotic Process Automation)の連携などです。
- 改正電子帳簿保存法により、日本でも需要が急増するOCR
- 日本国内においては、2022年1月1日より、改正電子帳簿保存法が施行され、国税関連の帳簿・書類のデータ保存について、抜本的な見直しが行われました。2021年12月10日に発表された「令和4年度税制改正大綱」では、「電子取引」に関するデータ保存の義務化について、2023年12月末まで2年間に行われた電子取引については従来どおりプリントアウトして保存しておくことが認められていますが、その後は電子取引への対応が求められることになります。改正電子帳簿保存法では、国税関係の書類や帳簿を原則7年間保管という義務があります。そのため、現在の書類や帳簿の電子化に迫られ、OCRに注目が集まるようになりました。