本をデータ化する・本から語句を検索できるようにするサービス
こんにちは。水口です。
こんな記事↓がありました。
本をまるごとデータ保存サービス!手頃な価格なら利用する? |
リサーチのrTYPE[アイシェア]
■ 本をデータ化するサービス
(『』内は引用です)
『手持ちの本をスキャンしてPDFデータにしてくれるサービスが登場している。ネット
ユーザーは、このようなサービスについてどう考えているのか、調査を実施。有効
回答数は、20代から40代の男女526名。
雑誌や書籍・文庫など種類を問わず、自宅にどのくらい本があるかを聞いたとこ
ろ、50.2%が「収納スペースに収まらないくらいたくさんある」と回答。「収納スペ
ースにギリギリ収まるくらいある」人は28.1%、「たくさんあるが収納スペースには
余裕がある」人は7.6%、「収納スペースを必要としないくらい少ない」人は14.1
%。また、手持ちの本を処分したことが「ある」人は86.5%。そのうち、後で読み
返したくなったことが「ある」人は 57.6%、「ない」人は42.4%。』
(上記記事より引用)
とあります。
『収納スペースに収まらないくらいたくさんある』という人が半数もいるのは、
ちょっと意外な気がしました。
(「世の中、マメに本を読む人は意外に少ない」という印象を持っているので)
これなら、本をスキャンするサービスというのも有望かもしれませんね。
(著作権上どうなるのか・・・というところが、ちょっと気になりますが)
個人的には、ちょっと利用してみたい気もします。
■ 「スキャンによる本のデータ化」に関して
私の場合、裁断機(←本も裁断できるもの)とシートフィードスキャナはあるので、
裁断→シートフィードスキャナという流れで、本をPDF化することもできます。でも、
これが結構面倒。1冊や2冊ならいいですが、何十冊もやる気にはなりません。
また、(画像データとして)スキャンした本をパソコン上で見る場合は、結構動作
が重い感じになります。最初から電子ブックとして作られたファイルとは違って、
画像として読み込むので重くなってしまうわけです。また、電子ブックや通常の
PDFと比べると、スキャンを介している分、画質としてはやや落ちます。
よく参照する本は、スキャンするより、本で持っておきたいというのが、個人的な
感覚ではあります。
結局、あまり参照しない本だけど、処分するにはしのびない。そんな本がスキャ
ン対象になってくるのかな・・・と個人的には思っております。
でも、そういう本って、スキャンした後、結局見返すことはないのでは? という
疑問もわいてきますね・・・。ちょっと悩ましいところはあります。
■ データ化サービスの業者さん
ちなみに、そういうサービスをやっているのが、こちら↓
BOOKSCAN(ブックスキャン)
低価格・書籍スキャンサービス - 大和印刷
雑誌や辞書はダメ(←紙質の問題で)とか、スキャン中にトラブルが発生する
可能性が皆無ではない(←貴重な書籍は受けられない)。あるいは折り目が
ある書籍もNGといった制約はあるものの、面白いサービスだと思います。
価格は1冊(350ページ以内の場合)、基本のスキャンが100円。
ファイル名を書籍タイトルに合わせるオプションが +50円。
OCRで本文検索が効くようにするオプションが +100円です。
基本+OCR付きで200円は結構魅力的ですね。
■ PDF化+OCRは使えるか?
ちなみに、私が自分でスキャンしたものを、Adobe AcrobatでOCRをかけた
感じでは、本文はかなり精度よくテキスト化できていました。ただし、見出しは
正しくテキスト化されないことがあります。書体が急に変わるとダメですね。
※ 画面上で読む分には、画像として処理されますので、問題なく読めます。
(検索できるようにするためのOCRです)
ちなみに本文は、1行ごとに改行が入ったデータになりますので、普通のワー
プロ文書のように、コピーペーストして違う書式に流し込むと、改行がジャマに
なります。改行をカットすればいいだけの話ですが・・・ 一応念のため。
(検索は語句が改行をまたいでも大丈夫です)
このOCRは、自分で(Acrobatを使って)やると処理時間が結構かかります。
これも含めて、すべてお任せでできるというのは魅力的ですね。
検索できるかどうかの違いは、後で結構ひびいてきますから、やるなら、
OCR込みで頼むのがおすすめです。
(Acrobatがあれば後からOCRするのも可能ですが、時間はかかります)
・・・と、かなり使えそうなサービスなのですが、私の場合、問題はページの端を
折っちゃった書籍が多いことなんですよね・・・(汗)
今日の記事作成時間は45分でした。
では、また明日!
Posted by 水口和彦 at 23:55│Comments(0)│TrackBack(0)
時間管理術研究所の無料メールマガジンで
モチベーションアップしてみませんか?
バックナンバーはこちら
Copyright (c) 2005-2014 BizARK Inc. All rights reserved.
※ スパムコメントがあまりに多いため「http://」は使用不可の設定にしています。
URLをご紹介頂く場合は「http://」を省くか全角文字を使用して頂けますと
幸いです。











(参照リンクの無いトラックバックは受け付けておりません)