2014-01-03

書籍の取り込みと整理

年末年始の休みを利用して書籍の電子化、いわゆる自炊を少しずつ進めています。
まとまった時間が無いとなかなか手をつける気にならなかったのです。
それでも一日に10~16冊程度、2~3時間でできる程度にしています。
一気に取り込もうとすると疲れるので。

本を取り込むには、次のステップが必要です。

  1. 本の選定。
  2. 裁断(裁断機による本体の裁断、カッターによるカバーの裁断はスキャン直前に行うことが多い)。
  3. スキャン(ScanSnapによるスキャン設定の調整と取り込み)。
  4. PDFファイルの加工(ページの結合や回転、ファイル名の設定、閉じ方向の設定)。
  5. 文字認識。
  6. 分類。
  7. バックアップPCへの転送。

これらを一冊ずつやるのではなく、ある程度まとまった冊数ごとにやることにしています。
つまり、次のような流れになります。

  1. 取り込む本を30冊くらい床に積む。
  2. 選んだ本を裁断機で裁断する。裁断機は重くて取扱が面倒なので、スキャンと平行して行わず、まとめて行うようにした。
  3. 適当な冊数(15冊くらい)まとめてスキャンする。カッターでカバーを切り、スキャンし、PDFを加工する。
  4. スキャンした本を文字認識(検索可能なPDFに)する。一冊スキャンする毎に文字認識すると、微妙な予測できない待ち時間が発生するので、後で一括で行うようにした。
  5. スキャンした本を分類する。フォルダ分けする。分類が直感的に分かるものはそうする。分からないものは日本十進分類法(NDC)で分ける。
  6. スキャンした本をバックアップPCへ転送する。
  7. 裁断した本が残っているなら3へ。
  8. 裁断した本が無くなったら1へ。

疲れたらどの段階で中断してもOKです。

最近ようやくライブラリが充実してきて、電子化の意味が出てきつつあります。
これまで、どうでも良い本から取り込んでいく方針で進めてきました。
そうするとせっかく苦労して取り込んでも、そのデータにアクセスすることはほとんど無いわけです。
何のためにスキャンしているんだろうと疑問に思うこともしばしばありました(部屋が片付くくらいの意味はあるのですが)。
最近は読まずに放置されている本(いわゆる積ん読)も少しずつ取り込んでいます。
電子化することで読むきっかけになればという期待を込めつつ、読まれなくても損は無いとの考えです。