YomiToku で漫画のOCRを試す
「YomiToku」で漫画のOCRを試したのでまとめました。
1. YomiToku
「YomiToku」は、ローカルサーバーで実行可能かつ、日本語文書に特化したOCRおよびドキュメント画像解析を行うPythonパッケージです。
2. Google Colabでの実行
「Google Colab」での実行手順は、次のとおりです。
(1) パッケージのインストール。
# パッケージのインストール
!pip install yomitoku
(2) 左端のフォルダアイコンでファイル一覧を開き、「sample.png」をアップロード。
・sample.png
(3) OCRの実行。
# OCR
!yomitoku sample.png -f md -o results -v --figure
「results」フォルダ下に3つのファイルが出力されます。
・_sample_p1_layout.jpg
・sample_p1_ocr.jpg
・_sample_p1.md
あう〜
ファイルサイズ<br>ぜんぜん小さく<br>ならないよ
どうしよう<br>i坊
ファイルサイズ<br>小さくするには<br>コツがあるからな
クラスや<br>メソッドの数を<br>少なくしたり
1つの変数を<br>使い回したり
プリプロセッサ<br>を使ったり
逆アセンブル<br>して無駄ないか<br>チェックしたり
さすがi坊<br>その方法で<br>小さくして<br>おいてね
300K