2010年05月11日     このエントリーをはてなにブックマークこのエントリーを含むはてなブックマーク

本をデータ化する・本から語句を検索できるようにするサービス


こんにちは。水口です。

こんな記事↓がありました。

本をまるごとデータ保存サービス!手頃な価格なら利用する? |
リサーチのrTYPE[アイシェア]



■ 本をデータ化するサービス

 (『』内は引用です)
 
『手持ちの本をスキャンしてPDFデータにしてくれるサービスが登場している。ネット
ユーザーは、このようなサービスについてどう考えているのか、調査を実施。有効
回答数は、20代から40代の男女526名。

雑誌や書籍・文庫など種類を問わず、自宅にどのくらい本があるかを聞いたとこ
ろ、50.2%が「収納スペースに収まらないくらいたくさんある」と回答。「収納スペ
ースにギリギリ収まるくらいある」人は28.1%、「たくさんあるが収納スペースには
余裕がある」人は7.6%、「収納スペースを必要としないくらい少ない」人は14.1
%。また、手持ちの本を処分したことが「ある」人は86.5%。そのうち、後で読み
返したくなったことが「ある」人は 57.6%、「ない」人は42.4%。』

                                   (上記記事より引用)
とあります。

『収納スペースに収まらないくらいたくさんある』という人が半数もいるのは、
ちょっと意外な気がしました。
(「世の中、マメに本を読む人は意外に少ない」という印象を持っているので)

これなら、本をスキャンするサービスというのも有望かもしれませんね。
(著作権上どうなるのか・・・というところが、ちょっと気になりますが)

個人的には、ちょっと利用してみたい気もします。


■ 「スキャンによる本のデータ化」に関して

私の場合、裁断機(←本も裁断できるもの)とシートフィードスキャナはあるので、
裁断→シートフィードスキャナという流れで、本をPDF化することもできます。でも、
これが結構面倒。1冊や2冊ならいいですが、何十冊もやる気にはなりません。


また、(画像データとして)スキャンした本をパソコン上で見る場合は、結構動作
が重い感じになります。最初から電子ブックとして作られたファイルとは違って、
画像として読み込むので重くなってしまうわけです。また、電子ブックや通常の
PDFと比べると、スキャンを介している分、画質としてはやや落ちます。

よく参照する本は、スキャンするより、本で持っておきたいというのが、個人的な
感覚ではあります。


結局、あまり参照しない本だけど、処分するにはしのびない。そんな本がスキャ
ン対象になってくるのかな・・・と個人的には思っております。

でも、そういう本って、スキャンした後、結局見返すことはないのでは? という
疑問もわいてきますね・・・。ちょっと悩ましいところはあります。


■ データ化サービスの業者さん

ちなみに、そういうサービスをやっているのが、こちら↓

BOOKSCAN(ブックスキャン)
低価格・書籍スキャンサービス - 大和印刷


雑誌や辞書はダメ(←紙質の問題で)とか、スキャン中にトラブルが発生する
可能性が皆無ではない(←貴重な書籍は受けられない)。あるいは折り目が
ある書籍もNGといった制約はあるものの、面白いサービスだと思います。


価格は1冊(350ページ以内の場合)、基本のスキャンが100円。
ファイル名を書籍タイトルに合わせるオプションが +50円。
OCRで本文検索が効くようにするオプションが +100円です。

基本+OCR付きで200円は結構魅力的ですね。


■ PDF化+OCRは使えるか?

ちなみに、私が自分でスキャンしたものを、Adobe AcrobatでOCRをかけた
感じでは、本文はかなり精度よくテキスト化できていました。ただし、見出しは
正しくテキスト化されないことがあります。書体が急に変わるとダメですね。

※ 画面上で読む分には、画像として処理されますので、問題なく読めます。
   (検索できるようにするためのOCRです)

ちなみに本文は、1行ごとに改行が入ったデータになりますので、普通のワー
プロ文書のように、コピーペーストして違う書式に流し込むと、改行がジャマに
なります。改行をカットすればいいだけの話ですが・・・ 一応念のため。
(検索は語句が改行をまたいでも大丈夫です)


このOCRは、自分で(Acrobatを使って)やると処理時間が結構かかります。
これも含めて、すべてお任せでできるというのは魅力的ですね。

検索できるかどうかの違いは、後で結構ひびいてきますから、やるなら、
OCR込みで頼むのがおすすめです。
(Acrobatがあれば後からOCRするのも可能ですが、時間はかかります)



・・・と、かなり使えそうなサービスなのですが、私の場合、問題はページの端を
折っちゃった書籍が多いことなんですよね・・・(汗)


今日の記事作成時間は45分でした。
では、また明日!


このエントリーを含むはてなブックマークこのエントリーをはてなにブックマーク
Posted by 水口和彦 at 23:55│Comments(0)TrackBack(0)

時間管理術研究所の無料メールマガジンで
モチベーションアップしてみませんか?
メールアドレスを入力すれば登録できます! → 
バックナンバーはこちら
Copyright (c) 2005-2014 BizARK Inc. All rights reserved.
この記事へのトラックバックURL
(参照リンクの無いトラックバックは受け付けておりません)
 

※ スパムコメントがあまりに多いため「http://」は使用不可の設定にしています。
  URLをご紹介頂く場合は「http://」を省くか全角文字を使用して頂けますと
  幸いです。