OCR（おーしーあーる）

最終更新：2026/4/25

OCRは、印刷物や手書き文字などの画像データを読み取り、文字情報に変換する技術である。

別名・同義語光学文字認識文字認識

ポイント

OCR技術は、紙媒体の文書をデジタル化し、検索や編集を容易にするために広く利用されている。

OCRの概要

OCR（Optical Character Recognition：光学文字認識）は、画像化された文字情報をコンピュータが認識可能なデータに変換する技術です。スキャナで読み取った書類や、デジタルカメラで撮影した画像に含まれる文字をテキストデータとして扱えるようにします。

OCRの初期の研究は1914年に始まりましたが、実用化が進んだのは1990年代以降です。当初は特定のフォントや高品質な画像に限定されていましたが、近年ではAI技術の発展により、様々なフォントや手書き文字、歪んだ画像にも対応できるようになりました。

OCRの基本的な流れは以下の通りです。

OCR技術は様々な分野で活用されています。

OCR技術は進化していますが、以下の課題も存在します。