前回までのコラムでは、企業のデジタル化や働き方改革の取り組みとして注目されている「RPA」を取り上げました。確かに「RPA」というキーワードがついているとイベントや展示会などでのお客様の反応も大きく、とても興味を持って頂ける領域であると感じています。
一方で、実際にブースにいらっしゃるお客様の声の半分は以下のようなもので「RPA」というよりは、OCR(Optical Character Reader、光学的文字認識)による文書の電子化(デジタル化)が最初のハードルになっているといったところでしょうか?
(GRANDIT DAYS 2018 会場でお聞きしたお客様の声)
・現状FAX、メール、Excel、紙ベースによる人手業務が中心で自動化できそうもない
・取引先ごとにフォーマットが違うので、読取りのための定義が取引先ごとに必要となり、導入が大変
・手書きの書類なども多く、OCRなどで取り込んでも認識率が心配
そこで、今回のコラムからは多くのお客様が課題とされている、文書の電子化といった課題について掘り下げつつ、最新のAI-OCRやそれらを使った様々なサービスについてご紹介したいと思います。
■ 文書の電子化(デジタル化)の現状
文書の電子化というとe-文書法や電子帳簿保存法といった言葉を耳にすると思います。広く文書の電子保存を容認することでICTの活用による書面や帳簿書類の保存にかかる負担を軽減して利便性の向上を図ることを狙いとしています。
このような法整備がなされている中、電子化の状況はどう変化しているのでしょうか?
今日、多くの企業では企業内の様々なデータをタイムリーに処理するため、ERPなどのシステムを導入し「電子化(デジタル化)」を行っています。しかし多く場合、取引先とのやり取りについては、自社のERPから出力した請求書を支払先に送付し、取引先から受け取った請求書を自社のERPに入力するといった「アナログな処理」になっているのでは無いでしょうか?
自社内の電子化(デジタル化)が進んでいるものの、外部との連携においては電子化(デジタル化)があまり進んでいないというのが多くの企業システムの現状だと思います。
■OCR誕生と歴史
OCRは、紙媒体を光学的(Optical)に走査して画像イメージとして取り込み,文字(Character)を抽出して認識する装置(Reader)です。キーボードに代わる文字入力装置で、キー入力する代わりに大量一括の自動入力を可能とした省人力装置だそうです。(ここだけ読むと確かに「RPA」みたいな機能ですね)
最初の製品化は1968年7月、葉書上部にある赤枠内に書かれた郵便番号を読み取ることで郵便局ごとに葉書を仕分けることに使われたそうです。OCRの歴史をまとめるのがコラムの趣旨ではありませんのでこれくらいにしておきます。興味のある方は、出典元のリンクを記載しておきますので是非ご覧ください。
(出典:一般社団法人情報処理学会「コンピュータ博物館」よりhttp://museum.ipsj.or.jp/computer/ocr/history.html)
■OCR製品の種類
OCR製品は定型帳票の読取りを対象とする「帳票OCR」と新聞や雑誌などの活字文章全体を読み込むための「文書OCR」の2つに分けられますが、最近特にビジネス領域で注目されているのが「帳票OCR」の進化です。
【OCR製品の種類】
■OCR技術の状況と課題
では、OCRの技術は現在どのような状況なのでしょうか。課題についても整理してみましょう。
・識字率UPの限界
文字認識の精度は識字率といった形で表されます。最近の技術の進歩により識字率は向上しており、印字品質の良い文書では高い精度で文字認識ができるようになってきています。
特に最近注目されているAIを活用したOCRツールやサービスが登場しており、場合によっては手書き文字の認識においても識字率が99%を超えるものもあります。一方で文字認識は実際にスキャニングした環境などによって精度が左右されるので識字率が100%になることは無いもいわれています。
・非定型書類の問題
OCR で業務上の書類を読み取るには、書類フォーマットごとにデータを抽出する位置を事前に定義したうえで、スキャニングして文字情報をデータ化します。
実際に運用するには、これらの書類フォーマット定義を事前に行う必要があるため、書類の定型化が可能か対応するフォーマットの種類が少なければ運用することができます。しかし、実際の業務では取引先ごとに書類のフォーマットが異なることが多く、取引先が多い場合、事前に定義することは非常に困難です。
・データ入力時の課題
OCRは、紙のデータを読み取りデジタル化する、いうなれば人の目にあたる技術です。一方RPAは、人が行う操作を代行するものであり、人の手足にあたる技術です。そしてデータ入力時には人間が介在し読み取り精度を補う必要があります。現時点では、これらの一連の処理全体が自動化されていないので、各機能をうまく連携させながら利用する必要があります。
それでは今回はこれくらいにして、次回のコラムではAI-OCRを中心とした様々な製品やサービスの最新動向や自動化範囲を広げるために期待されているRPAなどとの連携イメージなどについてご紹介したいと思いますのでどうぞご期待ください。
※日商エレクトロニクスのAI-OCRソリューションについてはこちらをご覧ください。
高橋 昇 プロフィール
GRANDIT株式会社 マーケティング室 室長
1985年 総合商社系情報システム会社(現インフォコム株式会社)へ入社。商社向けシステム開発部門に所属し、繊維・化学品・食品関係などのシステム開発やC/S・WEBシステム、ミドルウェアなどのアーキテクチャー選定・導入を担当。2003年10月 インフォベック株式会社(現GRANDIT株式会社)にて、次世代ERPコンソーシアムによるERP「GRANDIT」の開発に立ち上げ当初より参画。パートナー営業・製品開発の責任者としてERPシステムの提案活動・導入支援に従事。2018年よりマーケティング室 室長として、営業・製品開発をあわせたマーケティング施策の企画立案とプロモーション全般の責任者を担当。 GRANDIT公式サイトはこちら