本をキレイにデジタル取り込みする方法(1)

本がたくさんあると、部屋が狭くなる。

しかし、本を箱詰めして しまいこむと、取り出すのが大変だ。
なので、本は画像データ化してパソコンに取り込んで、パソコンで読むことにする。これなら場所もとらないし、パソコンあれば読める。


はい。


今はドキュメントスキャナーというものがあるんだ。
複数の紙を自動的に一枚一枚読み込んで、パソコンに取り込んでくれるぞ。
たとえばこんなのがある。


FUJITSU ScanSnap S1500 FI-S1500

FUJITSU ScanSnap S1500 FI-S1500

  • 出版社/メーカー: 富士通
  • 発売日: 2009-02-07
  • メディア: Personal Computers

これを使ってパソコンに取り込もう。


ふむふむ。


それでは手順を示すぞ。

* 本を裁断する
* ドキュメントスキャナーでスキャンする (JPG取り込み)
* フォトショップで画像補正して、読みやすくする


JPG取り込み? PDF取り込みのほうが便利では? PDFだと1冊が1ファイルにまとまるし。それにPDFだと「透明テキスト」を埋め込んで、テキストとしてコピーできるし、検索もできるんだよ。


いったんJPGにしてしまっても、画像を補正して読みやすくしてページ抜けもなくして、その後で「透明テキスト」つきのPDFを作ることができるんだ。

まあ個人的には検索はしないし、JPGのほうが便利だと思うけどな……。


へー。

裁断

まずは、本を裁断して、1ページごとに1枚の紙に分解するぞ。


裁断機にはPLUS PK-513 というのを使っている。

PLUS 断裁機 裁断幅A4 PK-513 26-128

PLUS 断裁機 裁断幅A4 PK-513 26-128

  • 出版社/メーカー: プラス
  • メディア: オフィス用品


緑のマルつけたところからカッターが見えるんだ。取っ手を引き下ろして裁断する。


本が厚くてここを通らないときは、まず本をカッターで、通る厚さに分けて、数回で裁断するんだ。


サクッときれるもんなの?


サクッというほどではない。もっとチカラがいるな。文庫本や新書など紙の薄い本は、ギュッと押し込めば簡単に裁断できる。でも紙のしっかり厚い本なんかだと、取っ手に両手を乗せて体重かけてグッグッと少しずつ押し込む感じで裁断するんだ。


ギロチンみたいだな。


これは小さな子供のいる家にあると危ないと思うぞ。大人の一人暮らししているオレでも、この裁断するとこには手を通さないよう気をつけている。

これで裁断が終わって、1ページごとに1枚の紙に分離できた。

スキャン

次は取り込みだ。オレの使っているドキュメントスキャナーは Canon DR-2080C というので、TWAIN(トウェイン)規格に対応しているんだ。


お値段はどれくらい?


これは初期のモデルだから、12万くらいした。


えっ!?


今は後継機が出てて、5万以下で手に入るぞ。

Canon imageFORMULA DR-2510C 2455B001

Canon imageFORMULA DR-2510C 2455B001

  • 出版社/メーカー: キヤノン
  • 発売日: 2007-11-06
  • メディア: Personal Computers

……Amazonのレビューで批判されてるよ。


ドキュメントスキャナは、「何十ページも自動的に読み込んでくれる」という機能がすごいのであって、取り込み画質はフラットベッドスキャナ(1枚ずつ手動で紙を取り替えて取り込む) には劣るぞ。

でも一枚一枚紙を取り替えて、1日1000ページ取り込むなんてできないだろ、常識的に考えて。でもドキュメントスキャナなら1日4冊1200ページでもラクに取り込みできるんだ。


なるほどー。ところで重送って何?


重送(じゅうそう)ってのは、1枚ずつ取りこむはずが、2枚とか3枚まとめて取りこんでしまうことだよ。ウチでは、紙が厚いときはまったく起きないけど、紙が薄い文庫本の取り込みなんかだとたまに起きることがある。取り込んだ後でチェックして、もし重送してたら再取り込みすればいい。


取りこんだ後のチェック?…


あとで説明するよ。


TWAINに対応しているスキャナの場合、本体付属のスキャンソフト使わなくても、別のソフトを使って画像取り込みができるんだ。
ここでは BTScan http://homepage2.nifty.com/tsugu/software/ というソフトを使って取り込む。


BTScanの設定は JPEG出力品質を100%にしておく。

取り込み設定はカラー本の場合、こんなだ。

24ビットカラー・600dpiにしている。
明るさ・コントラストは、あとでPhotoshopで画像補正するので、あえてここでは初期値のまま変更していない。


600dpiはデータとして大きすぎない?PC画面上で読むなら150〜200dpiもあれば十分でしょ。


パソコン関連の本は、デスクトップ画像とか細かい絵柄があってな。それをしっかり見るためには、240dpiは必要だと思う。

以下の画像は、Wordでマスターする使えるビジネス文書 レイアウトの極意のものだが、150dpiだと読むのに無理があるだろ?



それに、最初は600dpiで取り込んで あとで画像補正して縮小したほうがきれいな画像になるんだ。

たとえばPC関連の本だと、以下のように最初から240dpiで取り込んだものと、600dpiで取り込んだ後で240dpiに変換したものでは、ちがうだろう?


240dpiのは モアレがきついねー。


だから最初に600dpiで取りこんで、あとから240dpiに変換するのがキレイなんだ。


キレイなのはわかったけど、600dpiだと、240dpiに比べても、スキャナの取り込み時間が余計に かかるんでは?


3倍以上かかる感じだな。295ページあるこの本だと……取りこむのに2時間25分かかってる。


ゲゲッ!


といっても別に大変じゃないぞ。たまに20枚ずつ紙を補給する以外はほったらかしでいいんだ。2chまとめサイトやニコニコ動画とかTV見てるあいだに終わっているよ。

ちなみにハードディスク容量はカラーで取り込むと、600dpiだと1冊4GBくらい使っている。あとで240dpiに変換すれば、一冊200MBくらいに小さくなるよ。


続き: [スキャナ 書籍] 本をキレイにデジタル取り込みする方法(2) http://d.hatena.ne.jp/itouhiro/20081225