2013-05-26

Kindle Paperwhiteで数式入り論文を快適に読む

まえがき

先日,Kindle Paperwhiteを買いました. 主に論文等を読むためのPDFリーダとしての機能を期待していたのですが,

  • 自炊したPDFは拡大縮小時にギザギザが目立つ(最近傍法?).
  • テキスト情報が含まれるPDFを拡大してもリフローしてくれない.

というわけで予想よりもちょっと残念な感じでした.
しかし,Paperwhiteは単語長押しで辞書を引く機能がありますから,それは捨てがたい…….

そういうわけで,Kindle Paperwhiteで論文を快適に読めないかと模索していました.
色々と調べた結果,最も良さそうな方向性としては,テキストはテキストとして扱い,図や数式を ラスタ画像に変換してKindle電子書籍形式(.mobi)にすることかなーと考えました.
が,どうもPDFに含まれる数式を検出して画像化するのは難しそうであることが分かり, 結局,Paperwhiteに最適なPDFを得るというアプローチをすることにしました.

やりかた

K2pdfoptというソフトを使います. PDFをKindleに最適な状態(実のところは上手い具合にKindleのディスプレイのドット数と同じ画素数の 画像の集まりとしてのPDF)へと変換してくれるソフトです.
リンク先のメニューのDownloadからダウンロードします.
ちなみに生の実行ファイルが落ちてきます.いまどき珍しいですよね…….

ダウンロードしたら,k2pdfopt.exeを適当な場所に配置します.
基本的にドラッグアンドドロップで使うことになるので,デスクトップらへんで良いでしょう.

では,さっそくPaperwhite向けに最適化したいPDFをk2pdfopt.exeに ドラッグアンドドロップしましょう.

こんな画面になると思います.
吐き出すPDFについて色々と設定できるのですが,とりあえずPaperwhiteに合わせた PDFのサイズ(横658px, 縦905px)を設定しましょう.
黄色い文字のEnter option above (h=help, q=quit):に続いて,dと打ちましょう.
その後の流れは以下の通りです.

Enter option above (h=help, q=quit): d

Select your e-reader type:
     1. Kindle 2 (k2)
     2. Nook Simple Touch (nookst)
     3. Kindle DX (dx)
     4. Kindle Paperwhite (kpw)
     5. Kobo Touch (kbt)
     6. Kobo Glo (kbg)
     7. Other (specify width, height, etc.)

Enter selection [1]: 7

E-reader display pixel width [560]: 658

E-reader display pixel height [735]: 905

E-reader display pixels per inch [167]: 180

Input/Source file pixels per inch (use -2 if not sure) [-2]:

最後の行の空欄は,何も入力せずにEnterを押したことを意味します.
下から2行目のE-reader display pixels per inch [167]: 180についてですが,本来のPaperwhiteの解像度にならって 212とすると出力されるPDFの文字サイズが大きくなりすぎるきらいがあるので,低めに設定しています.
素直にPaperwhiteの4番を選べばいいじゃないかという突っ込みもありそうですが, それを使うと,なんだかうまい具合にPaperwhiteに合った解像度で出力されないみたいなので, 手動で設定します.

さて,ここまでで下のような画面になっていると思います.

ここまできたら,そのままEnterを押します.

すると,次々と変換されていき,もとのPDFと同じ場所に<元ファイルの名前>_k2opt.pdfが 生成されます.

これをPaperwhiteに転送すれば良いのですが,生成されたPDFはテキスト情報を含まないので, このままではPaperwhite上で辞書を引く機能が使えません.
そこで,私はPDF-XChange Viewerを使ってOCRしてから転送しています.
私は英語でしか試していないのですが,確か言語を追加すれば日本語でもOCRできたと思います.

どんな感じになるのか

こんなPDFが

こんな感じに


こんなPDFが

こんな感じに

実機で見てみるとこんな感じ

ギザギザしていなくて読み易い.


表から数式まで,わりかしバッチリ最適化してくれます.

ちなみに

色々と問題がありそうなので例は出せませんが,自炊したPDF,つまり画像の寄せ集めとしての PDFであっても,文章の行を認識してリフローしてくれる(!)のがK2pdfoptの凄いところです.
たまに図が変に大きくなってしまったりしますが,「とりあえず持ち出して読む」といった用途であれば 十分実用的なレベルで最適化できます.

  1. ruttoco posted this
Prev