家の本をまとめて電子化するにあたって思った事・したこと・感想

bookscan

mountain of books By ginnerobot

今回は、タイトルにもありますように

・家の本を電子化しようと思うまでのいきさつ
・実行するにあたってどんな事をしたのか
・どんな手順でやったのか
・そしてやってみてどうだったのか

を、ものすごく長々と、だらだらと、どうでもいい話ばかり交えながら書いてみました。
一大スペクタクルです。


事の発端

はじまりは、去年末のことでした。
僕は昔から部屋のものを捨てられない、片付けの出来ない人間なのです。
そのため日頃から部屋はありとあらゆるモノが散乱し、学生の頃は遊びに来た友達が急に
「いいから今から掃除だ」と言って数時間かけて一緒に掃除をしたりするような
エンターテインメント性溢れるイベント会場に住んでいるわけです。

そして年末といえば、大掃除です。
毎年思いはするのです。「年末だし、綺麗にしよう!」と。
まあこれで綺麗になった試しはほとんどないのですが、今年も例に漏れずそのままになっていました。

そして年はあけ2012年1月、あー、また汚いまま年を迎えてしまった。てへへ。
なんて思って過ごしていた矢先、急に掃除をする気になったのです。
僕みたいな方なら分かっていただけるとおもうのですが、こういう掃除のできない人間は
「あれ?今掃除したい!」と思った時に、勢いに任せて掃除をしてしまわないと絶対に掃除なんてできないのです。

これはチャンスだと思った僕は、すぐさまマスクを着用し、汚れてもよさそうな格好に着替え掃除を始めました。
こう思い立ったら、いらないものをガンガン捨てます。普段ならどうしようかなあと迷う物でも
3ヶ月以上触っていないものはガンガン捨てます。勢いが大事です。後で後悔なんてきっとしないでしょう。
存在すら忘れている物ですから。そして服だのなんだのをもりもり捨て続けること半日。
びっくりするくらい綺麗になったかと思いきや、さほど綺麗になっていなくて逆にびっくりしました。
あの時ふと自分の口からこぼれた「まじかよ。」という言葉を今でも忘れません。

そしてその後はというと、翌日そんなつもりで来たわけではないお客様を巻き込んで
手伝ってもらいながら延々色々なものを捨て続けた結果、部屋はとっても綺麗になりました。
手伝っていただいた方には、心よりお礼とお詫びを申し上げます。

で、何かもうエントリのタイトルと内容が全く別物になってしまっていますが
まぁいいでしょう。

それでですね、掃除は終わったんですけど、何か部屋が狭いんですよ。
なんでかなぁ〜、なんでかなぁ〜と稲川さんぽく考えてみたところ、本が結構あったんです。
本棚に入っている本はまあ本棚に収まっているのでいいのですけれど、漫画・雑誌ですね。
片付けられない人というのは、使った物を元に戻せないのです。
読んではポイ。読んではポイ。しているうちに、床が本になっていたりします。
なので、これをどうにかすれば部屋は広くなるとおもったのです。
というわけで、もう読まなそうな雑誌は全部捨てました。

どこへ向かおうとしていたのかいまいち方向性の分からないファッション誌ですとか
最新CPUを活かす!Pentium4で作る自作PCみたいな
ちょっと今見ると苦い顔になりそうなコピーが表紙のパワレポですとかを
いらない!いらない!と力強く連呼しながら積んでいきまして、紐で縛って捨てました。

散乱していたうち、雑誌は片付きましたが残ったのは漫画です。
漫画は、もうきっと読まないなと思った物を全て近所の古本屋に持っていって売りました。
金額を聞いたときよりも、半分以上買い取れないと言われた時の方が噴き出しましたが
ハナからお金が欲しくて売ったわけではないので、潔く全て引き取ってもらいました。
物は大切にしなければいけないなと改めて感じました。

そして残ったのは、僕が唯一読んだ後でも高い確率で本棚に戻す本命、技術書の類です。
これをどうしようと思った時に、そのまま本棚にしまっておくのでもよかったのですが
元々結構興味があった電子化を、実行に移してみようと思い立ったわけです。

んで、どうする?

さて、思ってはみたものの、電子化なんてやったことないですし、道具も持ち合わせておりません。
知っているのは、色んな方のブログ等で見たことがあるなんとなく手順くらいです。

今回書籍をスキャンするにあたってのポリシー
  • 極力めんどくさい方法は避ける
  • 多少お金がかかってもある程度は綺麗にやりたい(ただしなるべく安く)
  • OCRもしたい
  • リファレンス系の本は敢えてスキャンしない

という感じで目標を掲げ、うん、どうしよう。と考えて見ることにしました。

電子化に必要な作業は(この時点で思っていたのは)大きく分けてこんな感じ

1.本の背表紙を裁断する
2.ドキュメントスキャナに裁断した本を入れる
3.うぃんういんスキャンしてる間に次の本を裁断する
4.1〜3を繰り返す
5.おしまい?

みたいな感じかなあと思っていましたが、結果から言うと概ねあってました。

よしじゃあ、裁断はどうやってやろうかなと考えたところ、いくつか選択肢が。

裁断方法の選択肢

こんな感じ。
とりあえず、思いついてはみたものの、プラスの裁断機は即却下です。
なんでかって?高いからです。流石にここで3万出したらポリシーの意味が全くないですし
3万をまあいいかで買えるほどお金持ちではありません。

次にCurlの裁断機。これは結構有力候補です。
なにしろ1万円弱とこれから始めるにしては手が出しやすいですし、評判も良さそうです。

次の、カッターでせこせこ切るという方法も、冊数によってはありかなと思ったのですが
ぱっと見100冊は優にありそうなので、これもまためんどくさいということで今回は却下しました。

さて次の、購入するには金額的にきつかったプラスの裁断機をレンタルするという方法なのですが
割と金銭的には良心的(だと思っているのですが、どうなんだろう)で
1週間程度で送料込みで7000円くらいとかが多いようです。
やったことないのでどれくらいかかるかは分からないですが、個人的な推測として
まあ3,4日ありゃ裁断は終わるだろうとおもっていたので、そのくらいの値段ならいいかなと候補に入れました。

ですが実際レンタルを行っているサイトをみてもらえると分かると思うのですが
もうなんかどこもかしこも大人気らしく、1ヶ月くらい予約がうまってるんですよね。
僕は完全にこれ思いつきで始めていますので、そんなに長々待っていたら絶対にやる気が削がれます。
それだけは避けたい。
となると、Curlの裁断機かなーと思って色々調べていると、お!というものを発見したのです。

それはなにかと言いますと、プラスの裁断機がお店にゴロンと置いてあって
そのスペースを時間計算で使える場所があったのです。
しかも安い!!1時間いても500円程度です。5時間いても2500円程度!
僕はもうこれだ!!と思って、さくっと数時間予約をとりまして、予約した日にそこへ行ったのです。

どういうことなんだよおおお

※普段あまりこういう事言いたくないのですが、本当に結構腹立ったので書いています。
そのお店というのがまあ都内の電気屋さんとかパーツ屋さんがたくさんある街に存在してるのですけども
まず行ってお店に入って、ここでどうぞーと通された席についた段階でちょっと嫌な予感したのですが
裁断機が違うんですよね。Webサイトにはプラスの裁断機が写真とか名前付きでのっていて
これで出来ますって謳っていたにもかかわらず、裁断機が別の物だったので若干、ん?と思いました。

まあでも、うまいこと切れればこっちとしては問題ないので、店員さんの説明を聞いて
(っていっても、ここに本入れてこのレバー引きながらこれ降ろしてください程度ですけど)
持っていった大量の段ボールの中から、まずは最初なので失敗しても良いように持って行っていた
割とどうでもよさげな本から試してみることにしました。

厚いと一回では裁断できないと言われていたので、用心深い私は割と少なめに本を分冊化しまして
そのカタマリを裁断機へと突っ込んで、胸をどきどきさせながらレバーを引いてみました。
うお・・・結構重い・・・これこんなしんどいのか・・・。
とか思いながらレバーを降ろしきってみました。
そしてレバーを上げ、ストッパーを外して入れた本を取り出してみると。

え?全然切れてないんですけど。

これでもまだ厚かったのかなあと思い、試しに30ページくらいでやってみることにしました。
流石にこれで切れないことはないでしょう。

でも、切れない(笑)

今思えば、取り出したところを写真に収めておけばよかったです。
なんというか、裁断されきってないんです。数ページは上から8割くらいまで切れてるんですけど
下が切れずに余ってしまっていて、底の方のページにいたっては何も切れていません(笑)
なんというか、刃を降ろした時に横から見ていると、刃が完全に食い込んでいるにも関わらず
切れていないんです。滑っちゃってるような感じなんです。

そのときは、荷物も多かったので優しいお友達と一緒に行っていたのですが
友達が
「これだめだよ。どんだけ分冊化すりゃいいんだって感じだし、そもそも話違うじゃん機種とか。
 これでこのまま続けてても時間食うだけだし、本も綺麗に切れなくて金もかかって良いことないよ」
と、僕が思っていたことをそのまま僕に伝えてきたので、予約時間分はお金を払うこと覚悟で
店員さんに、裁断できない旨を伝えて精算していただくことにしました。
すると、じゃあ20分経過していたので、200円です(正確には300円弱だったかも)と
いた時間だけで精算をしてくれたので、さっと会計をすませて店を後にしました。
店員さんなんかの対応含めて、僕はもう絶対ここは使いたくないです。

そんなこんなありまして、そのお店を出たわけなのですが
段ボール数箱を台車に乗せた私たち2人は、完全に行き場を無くした迷えるおっさんです。
こんなにも分かりやすく計画が破綻してしまうとは思ってもみませんでした。
「じゃあしょうがないから帰るー?」と友達が切なそうに声をかけてきましたが
そのとき僕は必死になって、”裁断 秋葉原”とかなんとか色んなキーワード入れてiPhoneでググっていました。

そうしたら、発見したのです!!

「自炊の森」を・・・。

〜いざ、自炊の森へ〜編

このお店、以前からネットの書籍電子化関連のニュースではちまちま聞いたことあったので
知ってはいたのですが、アキバにあったんですね。
※ちなみに自炊の森が行っているスキャンスペースや裁断済み書籍の在庫は利用していませんので触れません。

自炊の森のWebサイトを見てみると、”裁断代行”という文字があります。
おっ?と思って見てみると、1冊80円で業務用の大型裁断機でザクザクと切ってくれるそうです。
今回もってきたのは、比較的よく読みそうな技術書100冊程度だったので単純に計算して8000円ほどです。
んー、確かにさっきのレンタルスペースと比べると値段は跳ね上がりますが
プラスの裁断機をレンタルするのとさほど変わらないんじゃないかと思ったことや
もうここまで来て何もしないで本を持って帰るのが嫌で仕方が無かったので、その足で自炊の森に行き
「すいません、持ち込みなんですけど裁断お願いしたいのですが、だいじょうぶですか?」
と尋ねてみると、分かりましたと店員さんが段ボールから本を取り出して冊数を数えてくれました。

ここで思わぬ誤算がありまして、50冊以上は1冊60円になるそうで、100冊程度持参していた僕は
合計で6000円ほどで裁断していただけることになりました。
6000円で、自分はなんもしないで綺麗に裁断してもらえるなら割といい選択だったのかもしれん!
なんて思ったりしつつ、流石にそんなにすぐ終わるようなものではないらしいので、翌日また伺うことにしました。

そして翌日無事に森から裁断が完了した連絡をいただきまして、受け取りに行き
おー。綺麗に切れてる!なんて感心しながら、段ボール数箱を車に乗せて持ち帰ってきました。
結果から言ってしまうと、この値段さえ納得してしまえば、ここでの裁断はとってもお勧めです。
なによりハードカバーでもすごく綺麗に裁断されていますし、冊数が多いほど絶対自分でやるより早いと思います。
あとは多分、冊数が少なければその場でやってくれるんじゃないかと思います。

あと、これは今回言いたかった事のうちの1つです!
自分で裁断するより勇気がいらないのと、勢いで持って行けます。

自分の持っている本を裁断するというのは、結構勇気が要ります。というか僕は要りました。
大切な本ですし、物によっては金額的に安くない物も多いと思います。
それを切ってしまうと言うのは本当に勇気がいります。

これでちゃんとできなかったらどうしよう。
紙媒体の方がやっぱりよかったなんてことになったら・・・

考えたらキリがありません。
ですが「よしやろう!」と思っている勢いのまま持って行ってしまえば
こっちの心情なんてお構いなしでばっさりやってもらえるので、多少気が楽です。
これ、結構大事です。

裁断はできたけれども

さてさて、ここまで読んで頂いて薄々気づいている方もいるのではないかと思うのですが
こんなに必死に裁断をどうしようこうしようと策を練っている僕には
肝心のスキャンをするスキャナがありません。

でも今回これは実は既に解決していて、友人にドキュメントスキャナを持っている方がいたので
何日か貸してほしいとお願いしていたのです。

それで今回借りたスキャナがこれ。
Canon DR-2510C
DR 2510c
正直、ドキュメントスキャナはScanSnap S1500くらいしか知らなかったので
へー、こんなのもあるんだなあ。なんて思いながら貸していただきました。

そんなこんなでやっとスキャン実行へ!

スキャナとの生活編

今回は、付属のCDが見当たらなかったということでスキャナ本体と電源アダプタだけを借りることに。
まあCanonのサイト行けばダウンロードできるだろうと思ったらやっぱりあったので安心しました。
ただ、本来付属しているCapturePerfectというソフトは付属のCDからしかインストールできないらしく
最初これがないとできないんじゃないの?!とか思って正直結構焦りましたが
実際は、ダウンロードが可能なユーティリティのCaptureOnTouchだけでスキャンはばっちりでした。

では実際の手順

とかなんとか言いつつ、この手順がとても簡単で書く事がありません。

1.CaptureOnTouchを開いて、スキャナの設定を開きます。
scan設定1

2.カラーモードを本に合わせてグレースケールか24ビットカラーにします。
(今回は、少しでもグレーや黒以外の色が使われていそうな本はカラーにしました。)
scan設定2

3.あとは斜行補正だけチェックをいれます。
4.スタート!

詳細設定とかがあるので、もっと綺麗にとか色々あるんでしょうけど
とりあえず数冊これでやってみたのを見たりして、問題ないと判断しました。

なんだかんだ一回で90ページほどトレイに入れておけましたので
このセットした分がなくなったら、次の分を入れてまたスタートを押します。
これが一冊分終わったら、保存設定でJPGを選んで最高画質で保存して完了です。
本当は全部キャプチャー取りたかったのですが、スキャナ返してしまってその画面が表示できませんでしたorz
まあでも、実際やってみたらこんな説明いらないくらい簡単です。びっくりするほど簡単。
あと、終了時に1ページづつ連番のJPGで保存するか、まとめて1つのPDFにするかを選べるのですが
PDFにするのは後から他のソフトでいくらでもできるので、オリジナルの状態を保存するためにもJPGにしました。

これを延々とやっていくわけですが、意外とめんどくさくないです!
これも今回長々と色々書いてきた中で割と言いたいことの1つです。

意外とめんどくさくない!!

スキャンはそこそこ早いのですが、そんなにさっと1回のセット分が終わるわけではないので
何か作業をしながら、ウィンウィン言ってるのを横目に見たり見なかったりしながら放っておけます。
僕の持っている技術書は、800ページとかあるものは稀なので、大体平均400ページくらいだったかな・・・。
なので、1冊につき4,5セット分で終わるわけです。1セット分が大体5分かからないくらいだったはずです。
これを、飯食ったり作業したりなんだりしながら延々と回し続けた結果、3日目で全て終わりました。

今考えると、完全にスキャナと密接した濃密な3日間だったように思いますが、不思議と苦痛は感じなかったです。
自分の本がどんどん電子化されていく様子はちょっとワクワクするものがあったからかもしれません。
あとびっくりしたのが、もっとジャムるかと思ったんですけど、こんだけやって詰まったの5回くらいだった気がします。
詰まったのも、スキャナが悪いというよりは、表紙の裏に薄い紙が貼り合わせてあるパターンの時に
裏の紙がひっかかってしまってジャムっていたようなので、それは裏の紙をひっぺがしたりしてなんとかしました。

あとは、ページが重なった状態でスキャンされてしまう重送という現象ですが、これが2回しかなかったことに驚きました。
結構細かくページの端が折れてる本とかが多かったので、ひっかかっちゃうかなあと思っていたのですが
ちょっとやそっとでは重送は起きないようですね。もうちょっとめんどくさい事を覚悟してたのでいらぬ心配でした。

さて、次はPDFにしてみたいと思います。

AcrobatでPDFを作っちゃうぞ編

今回は、Acrobat X Proという現行バージョンのAcrobatを使いました。
金をかけないといいつつ結構高いソフトを登場させてしまいましたが
今回の為に買ったわけではないので許してください。
とりあえずAcrobatを開きます。
Acrobat1

そして画面中央の右にある、ファイルをPDFに結合という所をクリック!
するとこんなウィンドウが表示されます。
Acrobat2

そしてこのウィンドウに、さっきスキャンして出来たJPGを1冊分ドラッグ&ドロップします。
Acrobat3

右下の「ファイルを結合」ボタンをクリックすると単一のPDFにしてくれます。
Acrobat4

これは2,3分もあればサクっと終わります。できました!
Acrobat5

その後に、OCRでテキスト認識をさせます。
画面右にあるツールという部分をクリックすると、色々なメニューが表示されるので
テキスト認識というサブメニューから、このファイル内を選択します。
Acrobat6

するとこんなウィンドウが出るので、設定をこの画像のようにしてOKをします。
もしかしたらデフォルトと違うかも知れませんが、今回はこのようにしました。
Acrobat7

そうすると後は自動的に全ページのテキストを認識してくれます。
ちなみにこれは結構時間がかかります。具体的にどれくらいかと言うと、放置していたのではっきりは分かりませんが
30分くらいだったような気がします。できあがると、さっきの表紙の文字もテキスト認識されています!
Acrobat8

これでOCRで画像内の文章がテキスト認識されたPDFができあがりました!
あとは好きなだけPCやMac、スマートフォンからスキャンした本が読めますね!

実際やってみたけれども

今回、家の書籍を電子化してみた結論はと言いますと

思い切りが大事

やっぱり自分の本を切ると言うのは勇気が要ることだと思います。
ので、思い立ったらすぐ行動に移しましょう。やってみたら絶対ハッピーになれます。

裁断はよそに頼むのもアリ

今回は専門のところにお願いした結果となりましたが、本当に楽だったのできっと次の機会があったら
もう一度お願いすると思います。頻繁に本が増えてすぐ電子化したい方は裁断機やカッターなどで
自前で裁断したほうが楽だと思いますが、僕のようにたまにガツっとやりたいかたはお勧めです。

スキャンは意外とめんどくさくないし簡単

何度も言うけど、これは本当にびっくりした。思っていた数倍は楽でしたし
思っていた数倍は早く終わりました。1ヶ月くらいはスキャナ貸していただける予定だったのですが
あまりに早く終わってしまったので、そんなに優先度の高くなかったものも自前で裁断してスキャンしました。

Acrobatって結構すごい

Acrobatって、正直あまり使ってなかったのですがこのOCR機能が無茶苦茶便利でした。
何が便利って、テキスト認識に加えて、スキャン時の若干の傾きなんかも勝手に補正してくれるのです。
スキャン時にも斜行補正はかかっていますが、若干傾いていたりしています。(本当すこーしですけどね)
それがこのAcrobatでPDF化→テキスト認識をかけるだけで無茶苦茶綺麗になります。
画像ではAcrobat X のProを使っていますが、Standardでも同じ事ができますのでお勧めです!

人付き合いって大事

僕はあまり友達いないほうなのですけど、今回本当に色々助かりました。
人付き合いがなければまず掃除が終わっていませんし、
友達がいなければスキャナも借りられませんでした。
台車も、電気屋をやっている友達が貸してくれた物ですし
一人で全てを運ぶのもきっと大変だったことでしょう。
正直あまり人付き合いって得意じゃないんですけど、こういう時に助けてくれる友人は
日頃からよくして頂いてる方ばかりので、より一層大切にしないといけないなと感じました。
利害関係だけの話じゃないですよ(笑)

iPad3欲しい

これはオライリーで直接Ebookを買った時なんかにも思っていた事なんですけど
iPhone4でこの手の技術書を読むのは結構厳しいです。目がしぱしぱしてきます。
なので本当はKindleのような電子ブックリーダーを買おうと思っていたのですが
最終的な結論としてiPadを買うことにしました。
なんでそういう結論になったのかも比較記事にしてみようかな。
んでせっかく買うならもうすぐ出る(らしい)iPad3を買おうじゃないかと。
というか買います。絶対買います。
つか発表はよ!!!

長くなってしまいましたが、こんな書籍電子化の記録でしたー。
バラサバラサ

最後まで読んで頂きありがとうございます。
よろしければ右のボタンからフォロー・RSS購読していただけると幸いです。
暇つぶしの相手に最適です。

  • follow me
  • subscribe rss
  • このエントリーをはてなブックマークに追加
  • Pin It

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です