2025-10-01から1ヶ月間の記事一覧

OCRモデルTrOCRについて調べたまとめ

お疲れ様です。 今月の半ばくらいまで会社の勉強会の関係でAI OCRの手法の1つのTrOCRの調査と実装をしていました。 今回はそちらの内容をまとめて備忘録を書いておきます。 論文 arxiv.org 要約(from ChatGPT) TrOCR:Transformerベースの革新的なOCR技術 …

日本語特化OCR「YomiToku」を自作プログラムから動かす【備忘録】

お疲れ様です。 今回はOCR(光学文字認識)のお話。 OCR(Optical Character Recognition:光学的文字認識)は画像に含まれる文字をコンピュータで認識できるテキストの形で読み取る技術のこと。 最近だとOSSでYomiTokuが日本語特化OCRとしてはとても優秀で…