今回は、画像の中に書かれている文字(テキスト)を抽出するプログラムを作ってみましょう。スマートフォンやデジカメで手軽に写真を撮れるようになった昨今では、撮影・スキャンした手書きメモや文字データなどをテキストに変換したい場面が多いのではないでしょうか。

 画像の文字認識をするプログラム自体を一から作るのは大変です。Microsoftが提供する「MODI」のOCR機能を利用すれば、JavaScriptから手軽に文字認識を実行できます。今回は、MODIのセットアップと簡単なプログラムを紹介します。

OCRとその活用方法

 写真の中にある文字や、スマートフォンなどの手書き機能で書いたメモは、あくまで画像です。人間の目では読むことができても、そのままではコンピューターが認識することはできません。もちろん、検索してもその中の文字を探すことはできません。

 そこで、OCRの出番です。OCR(Optical Character Reader)とは、印刷された文字、または手書きの文字を光学的に読み取る装置のことを指します。OCRを使うと、画像データの中の文字を認識して、テキストとして出力することができます。テキスト形式であれば、文字を引用(コピー&ペースト)したり、検索することができます。