OCRとは?メリットや仕組み解説、簡単にOCRを試す方法も紹介!

OCRとは?メリットや仕組み解説、簡単にOCRを試す方法も紹介!

こんにちは、業務自動化ツール開発担当の吉池(@valmore_myoshi)です。

FAXや帳票といった紙媒体をめくりながらシステムにデータ入力する作業ありませんか?コピペもできず一文字ずつ手打ちしなければならない作業はかなりの労力がかかります。

紙媒体をデジタルデータに置き換えられたら、、、と思ったらOCRを使いましょう!

OCRってなに?と思うかもしれませんが、紙媒体をデジタルデータに変換する画期的なソフトウェアです。

本記事では、OCRの定義やメリット、利用イメージを解説し、最後にOCRを体験する方法も紹介します。紙媒体から脱却したい方やOCRに興味がある方はぜひ参考にしてください。

OCRとは?

OCRとは、印刷された文字や手書き文字をスキャナで読み取って画像化し、その画像から文字を識別してパソコンが利用できる文字データに変換する技術を意味します。

OCRのイメージ

OCRのメリット

OCRには下記3つのメリットが挙げられます。

  • データ利用が簡単
  • データを検索できる
  • 保管スペースがいらない

まず一つ目は何といってもデータ利用が簡単にできることです。これまでは紙媒体をシステムに転記するにはPCに一文字ずつ手打ちする必要がありました。しかし、OCRを使えば自動で紙媒体上の文字をデジタルデータに変換してくれるので、データ利用がかなり容易になります。

そして二つ目はデータを検索できること。紙媒体であれば目視で目的のデータを探さなければなりませんが、OCRでデジタル化してしまえば文字列でデータを検索できます。

最後に三つ目はデジタルデータであれば物理的な保管スペースが不要になります。紙媒体の中には法律上一定期間の保管期限が決められているものもあります。保管年数が長いとスペースを確保しなければなりませんが、デジタル化すれば気にする必要はありません。

OCRの仕組み

OCRが画像から文字を識別し、デジタルデータに置き換える仕組みは下記のステップを踏みます。

  1. 画像取り込み
  2. レイアウト解析
  3. 行の切り出し
  4. 切り出した行をデジタル化
  5. データ出力

最初に画像を取り込みます。どんな画像でも良いというわけではなく、解像度が高く、画像のズレなく、文字の輪郭が鮮明であるほど精度が良くなります。画像を読み込む前に必要に応じて画像の加工を行うこともあります。

読み込んだ画像はレイアウトを解析されます。一口に文章といっても見出しや節、段落と分かれています。このレイアウトを解析して画像のどの範囲をOCRの対象にするかを決めます。

基本的な文章構造

レイアウトを解析し、文字列のブロックを識別したら、次は行ごとに切り出します。文字列の塊のままでは文字を解析できません。一行ずつばらしてデジタルデータの変換へと進みます。

レイアウト解析から行の切り出し

OCRの活用例

OCRはさまざまな場所で活用されていますがRPAとの組み合わせが注目を集めています。RPAとは、パソコン操作を自動化するソフトウェアのことで、クリックやテキスト入力といった基本操作を模倣できます。

OCRとRPAを組み合わせれば、OCRでデジタル化したデータをRPAがシステムに自動入力するといった連携ができるようになります。

OCRとRPAの連携イメージ

例えば、紙帳票をOCRでデジタル化し、RPAで販売管理システムにデータ入力する。あるいは、FAXで届いた注文票にOCRを施し、在庫管理システムへの入力はRPAに任せるといった活用方法が挙げられます。

OCRを試してみよう!

OCRを体験する方法も2つ紹介します。簡単に試せるので、OCRの利用イメージの理解や精度の確認にぜひお試しください。下記のサンプル画像を使います。

吾輩は猫である原本

Googleドキュメントを使ったOCR

OCRを体験する一つ目の方法ではGoogleドキュメントを使います。GoogleドキュメントはGoogleが提供するWebサービスで、Googleアカウントを持っていれば利用できます。

OCRの使い方としては、Googleドライブの任意の場所に画像を置き、Googleドキュメントで開けばいいだけ。たったこれだけで画像上の文字をGoogleドキュメントに文字列として変換してくれます。

実行結果は下記のとおりです。文字サイズは調整できるとして、認識精度はかなり高いことがわかります。

Google Cloud Vision APIのデモを体験

二つ目の方法はGoogle Cloud Vision APIを使う方法です。Cloud Vision APIはGoogleが提供する画像認識に特化したクラウドサービスです。画像のOCRはもちろん、顔検出やラベル検出などさまざまな機能が用意されています。

公式サイトに画像をアップロードするだけでOCRを体験できるデモが用意されているので、とても簡単に試すことが可能です。

Cloud Vision APIの実行結果

まとめ

OCRの定義やメリット、仕組みを解説してきました。OCRを活用することで紙媒体からのデータ入力が格段に効率化することをお判りいただけたと思います。

紙媒体をなくせればOCRに頼る必要もありませんが、紙から脱却することはまだまだ難しいのが現状です。作業時間短縮のためにデータを手打ちしているところは積極的にOCRの活用を検討してみてください。