これは2008年に投稿したエントリーで、以前のブログから引き継いだものです。
仕事でやり取りするファイルの定番フォーマットのひとつがPDF。大体において、このフォーマットは編集しない、して欲しくない、参照されることだけを念頭に置いた文書のやり取りに利用されることが多いと思うのだけれども、最近多いのが、これにさらに保護機能を活用した文書を送ってくること。
こんな感じで、もうほんとに何もできない感じ。
こういう文書でも、そのページ数が数ページとか、せいぜい10ページくらいならば、LCDで参照するだけでも我慢できる。でも、それが数百ページに及ぶものになると...やはり印刷した上でじっくり読みたい。
ファイルがきちんと読まれることを想像した上で、そんな制限を設けているのだろうか?送りつけてくる方の気が知れない...ということなんだが、先方の事情はどうあれ、こちらはそれを読まなければならないのである。
うーむ、なんとかしたい。こういうときの常套手段は、
1.パスワードをクラックする。
2.テキストだけ抜き出して、それを印刷する。
前者を実施するにはそれなりのソフトウェアが必要なのですが、大体のところそれはシェアウェアだったりします。
しかしそもそも、やりたいことはテキストを抜き出したり印刷したかったりなだけでしょう?わざわざそのためにパスワードをクラックしますか?
というわけで後者を検討するわけです。後者を実施するにはコマンド系のツールを利用して、テキストだけ抜き出したファイルを出力するのが一般的だけれども、このソフトなんかGUIが利用できて高機能でお勧めです。
テキストと画像を別々に抽出してくれる機能を含んでいます。特に便利なのは、GUIが用意されているのとは別に、コマンド実行も可能ということ。なかなか気が利いています。
しかししかし、これでも制限された印刷機能を回避することはできないんですね。テキストだけ抽出できれば、それで良いのでは?いやいや、例えばですね。先の数百ページのPDF、元のファイルがPowerPointのモノだったりするとどう?テキストだけ取り出して、確実に内容が掴めるか?
それに、Excelのようなマトリックスが用意されていたりしても、テキスト抽出だけではそのレイアウトは維持できないのですね。こんな状況では、テキスト抽出ではなく、印刷できることが重要なのです。
というわけで、そんな保護機能を回避して印刷を実現してくれるソフトウェアがないか探してみたところ、ありました。
端的にはPDF viewerであって、先のPDF Explorerのような特別な機能は無し。それに単体のviewerとして見ると、売り文句の一つ、
高速な起動、軽快な動作
を実現している要素の一つであろう、ページ読み込みが1ページずつなため、複数ページのファイルを参照するときには厳しいものがあります。Page down/upやホイール操作でスクロールしながら参照することができないのですね。
けれども、印刷機能の制限を回避できることに意味がある!この点において、このソフトウェアは「使える」ソフトウェアになっています。利用期限が設けられてはいるけれども、無料で利用できるし、再インストールすれば継続利用も可能。
とはいえ、公式のADOBE Readerとは異なる仕組みで動作するソフトウェア。文書の再現性が完璧ではないのは、お約束と言いますか、そのソフトウェアが提供してくれる特別な機能とのtrade offの関係にある要素。
よくあるのが、レイヤー的に重なり合った画像の取り扱いが不十分なこと。いちばん上に表示される画像が、その下にあるテキストや画像を覆い隠してしまうことがあります。このソフトも、ご多分に漏れずそんなことがある。
けれども、一度に数百ページの文書を、モニタだけで読むことを考えたら、そんなページことオリジナルのファイルをモニタで参照すれば良いではないか!
というわけで、数百ページのPDFを15インチのLCDで読み続けなければならない苦行から解放されたのでした。
brava! reader、ありがとう!