電子書籍を Bullzip PDF Printer を使って無理やり PDF 化し,Acrobat のテキスト認識を使ってファイル容量を削減する。手間と時間がかかるのが難点。
私は語学学習のための教材として NHK ラジオ講座をつかっている。以前は紙のテキストを購入していたが,最近は電子版にシフトした。しかし,問題は思うように印刷ができないことである。そこで,電子書籍を PDF 化して,PDF を印刷することにした。
NHK 語学講座のテキストを扱っている電子書店はいくつもある (テキスト電子版 | NHKテキスト | NHK出版)。ここでは,仮想 PDF プリンタに印刷するという方法を使うので,「印刷可」の電子書籍を販売している書店を選ぶ必要がある。
年間購読もできて,途中解約もでき,印刷可能な電子書籍を販売している Fujisan.co.jp にした。電子書籍は割引があるのでお得である。Fujisan.co.jp では,「初めて利用する方に500円分のギフト券をプレゼント」キャンペーンをやっていて,これに惹かれたというのもある。しかし,ダメだった。初回の注文で5000円以上の場合にのみプレゼントだったからである (初めて購入されるお客様の500円割り引きについて | 雑誌のFujisan.co.jp|雑誌・定期購読専門オンライン書店)。1冊360円ぽっちの電子書籍ではお話にならなかった。その誤解させるようなキャンペーンの見出しはどうかと思うね。
Fujisan.co.jp の電子書籍は印刷ができるので,そのままプリンタ出力すればいいじゃないかと,当初は思っていたが,試したところ残念な結果になった。1枚のA4用紙に見開き2ページ分を印刷したいのに,1ページ分しか印刷されないのである。つまり見開き2ページ分を印刷指定すると,出てくるのはA4用紙2枚なのである。ナンダコレ? そこで,いったん PDF にしてしまって,その PDF を印刷することにした。
動作環境は,Windows 7 Professional, Firefox 41.0.2, Bullzip PDF Printer 10.11.0.2338 である。
PDF を作成できる仮想プリンタはいくつか種類があるが,どのプリンタでも電子書籍を印刷できるわけではない。Bullzip PDF Printer (窓の杜 - 【REVIEW】透かし挿入や暗号化などの機能をもつ無償のPDF作成ソフト「Bullzip PDF Printer」) では成功したが,Primo PDF や Acrobat Distiller では成功しなかった。
Bullzip PDF Printer を Download from Bullzip.com からダウンロードしてインストールする。Freeware Edition の制約は,各ページの下部に,赤字で「TRIAL MODE − a valid license will remove this message. See the keywords property of this PDF for more information.」と書かれることと,印刷するときに「ライセンス更新」 (このままトライアル版を続けるか) というダイアログにいちいち答えなければならないことである。
PDF 化の手順は以下の通り。Fujisan.co.jp のサイトない「マイラブラリ」から購入した電子書籍を開いて,次の順で処理する。
問題は,PDF のページが増えていくと,Bullzip PDF Printer がページを作成する待ち時間も長くなるということである。最初は15秒ほど待てばいいだけなのに,50ページになると1分30秒から2分もかかってしまうのである。テキストは150ページほどあるので,50ページ毎にファイルを分けておき,最後に結合するのが妥当なライン。
上記の手順の中で,Bullzip PDF Printer のオプションを設定するウィンドウが表示されるが,毎回設定しなおすのは面倒なので,デフォルト値として設定してまうのが便利である。ただし,設定箇所が分散しているので道に迷ってイライラする。以下の場所にあるので参考に。
Windows のスタートボタンから「Bullzip」→「PDF Printer」→「Bullzip PDF Printer オプション」を選択する。
いつも同じ設定であれば「ダイアログ」タブの「PDF の設定ダイアログをいつ表示しますか」オプションに「しない」を選択しておくとよい。これは是非お勧めしたい設定である。プリンタを選んで「OK」を押すと,最後のファイル保存までダイアログなしで完了する。
注意としては,ファイルの作成が完了する前に,次ページの印刷を始めてしまうと,ページが抜けてしまうことがあるということである。オプションで「作成後に作成先のフォルダを開く」を指定しているのはこのためである。フォルダが開いたら処理が終了したということが分かるからである。タスクトレイでも処理の進行をチェックできるが一手間かかる。
できあがった PDF ファイルは画像ファイルのかたまりなので,容量も大きいし,検索もできないしで,まったくいいことがない。Acrobat X Pro (有料) を使って文字認識させると,ファイル容量も削減してくれる。Bullzip で生成されたファイルは 400 MB もある。OCR 後は 70 MB 程度に圧縮される。しかし,出版社が作ったもともとの PDF の容量は 20 MB 程度のはずなので,これでも3倍以上になる計算である。
電子書籍を PDF のままで出してくれれば,テキスト情報入りなので検索も正しくヒットするし,容量も小さい。ところがコピーを恐れるあまりガチガチにガードした結果 (デジタル著作権管理 - Wikipedia),20倍の容量の画像ファイルになるというのは,おかしな話である。しかもベクトル形式でないので不鮮明。それを文字認識をして扱いやすくしたとしても,正確な文字認識ができているとは限らないし,ましてやフランス語まじりの日本語ではどっちつかずになることは明白である。何かがとても間違っている気がする。
2016年6月7日追記:
Kobo + calibre に移行しました (nlog(n): calibre で Kobo 電子書籍を管理)。
Master Archive Index
Total Entry Count: 1957