プロジェクトの説明

NHocrはオープンソースの日本語文字認識(OCR)プログラムです。Google Codeに置かれていたリポジトリは、NHocr 0.22以降、SourceForge.JPに移行しました。

SourceForge.JPの本プロジェクトでは、パッケージの提供に加えて、NHocrに関する日本語による文書提供などのユーザサポートを行います。

以下のサービスやアプリケーションでNHocrを試してみることができます。
* 日本語文字認識 (WeOCRサービス)
* Capture2Text

レビュー
あなたの評価
レビューする

統計情報

2015-01-02 00:32
どんぐりさんによるレビュー

評価:
(17 人中 11 人がこのレビューが参考になったと答えています)
Windows 上でビルドしました。 ・MinGW 上です。 ・freetype 2.5.4 は何故かgzipあたりでリンクエラーになるのでソースをコメントしました。(たぶん使ってないところだろうと思いました?) ・NHOCR 0.22 はシンボリックリンク関係を手動でコピー(ヘッダとLIB)しました。  以上でWindows上でも動作することを確認しました。 ・辞書のディレクトリを環境変数だけでなく、引数指定もあればうれしいかと・・  (いやはい、自分でやります) ・makechar 等のusage関係は読みましたが、今一つ辞書の取扱いがわからないです。  文献を探したのですが見当たらず・・  これもソースみるかと思いましたが、そのまえにレビューに書いとくと何かアップされるかな?^^;; と思ったり。(えぇまぁソース見ます) 15倍も早くしなくていいのですが、今後もよろしくお願いします。

2014-12-13 09:51
y_arakiさんによるレビュー

評価:
(15 人中 10 人がこのレビューが参考になったと答えています)
本のスキャン画像のページ番号(主に縦書き漢数字)を認識する、という限られた用途で試してみました。 ・Linux(CentOS6)上で、すんなりビルドできて動きました。 ・画像ファイルはPPMに変換しました(ImageMagickを使用)。 ・標準出力に出力する機能が意外と便利です。 ・縦書き漢数字の認識は、うまく行ったり行かなかったりでした。"一二三"等の縦書きは人の目で見ても識別しづらいので、仕方ないところでしょう。

2013-08-29 00:11
匿名さんによるレビュー

評価:
(14 人中 9 人がこのレビューが参考になったと答えています)
windows版を使用いたしました、resultのウインドウが出ないと、もっと連続処理が行いやすくなるのですが
レビュー一覧

最新の動き

2019-11-13
08:43
NHocr: 日本語文字認識プログラム
[チケット] #39727 にコメントを追記しました
[comment:3743:39727:54017 hgot] への返信 > 入力画像を見てみないと原因が判りませんが、罫線やルビな...
2019-11-06
10:36
NHocr: 日本語文字認識プログラム
[チケット] #39727 にコメントを追記しました
入力画像を見てみないと原因が判りませんが、罫線やルビなどの装飾、周囲にノイズとなる枠などが含まれ...
2014-08-30
21:06
NHocr: 日本語文字認識プログラム
20:19
NHocr: 日本語文字認識プログラム
活動履歴を見る