OCRは既存の書籍を編集可能な文書に❢

高精度・低価格なOCRサービス

OCR処理で検索やデータの活用が実現できます。
スキャナーでスキャン処理された書籍のデータは、そのままでは見たままの画像です。
書物として利用するにはこれで十分ですが、書籍の電子化のメリットを十分に活用しているとは言えません。せっかくデジタル化したのですから、更にこのデータを活用しようではありませんか。

PDFデータをOCR処理することによって、テキスト化されたデータはその体裁を変えたり、生きたデータとして再利用することが出来ます。
シンプルな単語検索を目的としたOCR処理から、一歩進んでデータを再利用した商業出版から、Excelでのデータ分析などにも使える高度なテキスト化などにも利用できます。

OCR処理・テキスト化で出来ること
 ・名簿や商品の表をExcelデータ化
   PDFの資料内での単語検索
 ・CSVデータの作成
   紙情報をWebサイトで活用
 ・紙の資料からWordデータを作成
   再編纂のためのDTPデータとして活用

ソフトの自動認識によるOCR処理
現在、当社でお請けできるOCR処理は、PDF上に自動的に透明テキスト文字を埋め込んでゆくソフトの自動認識によるOCRです。文字の校正・修正は一切行わないため最も廉価に電子データに文字情報を埋め込むことが出来ます。ただし、原稿の状態や、PDF画像の状況により多少の文字誤認識が発生します。

当社の書籍スキャンはOCR機能付加で完結します❢ 《検索機能付きのデータ化》これがモットーです。

「読む」から「活用する」
書籍をスキャンする=電子化するという目的の一つは、重く・カサばるばかりの従来の印刷書籍を、スキャンして扱い易いデジタルデータとして保存・活用するというのが大きな目的です。
数百ページの書籍が小さなフラッシュ・メモリーやDVDにデジタルデータとして収まってしまうという、現代の進化したAIテクノロジーは文明の象徴であった文字文化を、「読む」から「活用する」に変えてしまいました。著作者や編纂者の意思を、単に伝達・伝承することから活用・発展することに昇華させたのです。もちろん、著作者の著作物の思想や表現はそのままにして、「見る・読む」を超えて「利用する・発展させる」ところまで可能にしました。それが、スキャン・データを活用したOCRによる検索・再利用です。
著作者の権利を保護したまま、利用者の最新の意思を表現するさらなる発展や、理論の再構築まで可能になりました。
私ども「そのまんまスキャン工房」では、対象物の忠実なスキャン・再生はもちろんですが、これらはあくまで作業の通過点で、OCR処理による有効な再利用こそが、スキャン・再生の完結点であると認識しております。
したがって、当工房のスキャン作業は、原則としてOCR処理付きのデータ納品を既定とします。(機械処理のデータです。判読し難いものは未処理のものもあります。)

そのまんまスキャン工房
そのまんま フォト工房
株式会社文化新聞新社:運営
〒357-0021
埼玉県飯能市大字双柳1185-6
TEL 042-973-3840
携帯 080-5483-3840
FAX 042-973-3840
URL : https://www.bunkashinbun-shinsya.com
mail : ironman@da2.so-net.ne.jp
お問い合わせはこちらから