スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

【同じタグを付けた記事の一覧】

Presto! PageManager 9 と OCR の精度

2014年06月30日(月)23時28分

Presto! PageManager 9

Presto! PageManager 9NewSoft のドキュメント管理ソフトです。
ブラザーのプリンター&スキャナー複合機である「DCP-J552N」にバンドルされていました。

この Presto! PageManager 9 には、画像に含まれる文字と思われる部分を抽出し、文字列データに変換する「OCR」と呼ばれる機能が付いています。
経験上、この手の機能にはあまり期待しない方が良い、ということはわかっているのですが、せっかくついてきたものですので、試してみました。

ダウンロード

「どうせなら最新版を」ということで、製品の WEB サイトを辿り、「Presto! PageManager 9 インストールツール(PM9Downloader100.EXE)」をダウンロードしてきました。
この PM9Downloader は 400KB 程度の小さなツールで、ここに Presto! PageManager 9 そのものは含まれず、「Downloader」の名の通り、本体をダウンロードするだけのものでした。

インストールと制限

こういった製品バンドル版には、「対象機器が接続されていないとインストールできない」といった制限があるものがあります。
この Presto! PageManager 9 もそうで、インストール時に DCP-J552N が PC に USB や 無線 LAN で接続されていなければなりません。
ただ、正確にいうと「インストール時」ではなく、上記「ダウンローダーの起動時」です。
PM9Downloader の動作は、「Temp」フォルダ(通常は「C:\Windows\Temp\」)に「pm9」フォルダを作り、ここに本体インストーラをダウンロードして、そのインストーラを起動する、というもののようです(「pm9」フォルダはインストール終了時に削除されます)。
ですので、インストーラ実行中に「pm9」フォルダを別の場所にコピーしておくと、それを使用して直接インストールすることが可能になります。
そしてその場合には、DCP-J552N が接続されている必要はないようです。
まあ、結局はダウンロード時に DCP-J552N が接続されている PC が必要になりますので、「ライセンスに反して不正入手できる」というわけではありませんが、「インターネットに接続されていない PC にインストールしたい」というような用途では使えるかもしれません。
なお、インストールさえ済めば、Presto! PageManager 9 自体の起動には DCP-J552N の接続は不要のようです。
もっとも、ノート PC 等で使用していて、「出先でドキュメントを確認しよう」というときに、「プリンタが接続されていないので起動できません」と言われたのでは、さすがに使い物になりませんので、これは妥当な動作かと思われます。

「非純正消耗品に関する重要なお知らせ」を OCR

以下、Presto! PageManager 9 の OCR 機能について、実際のところどの程度の認識精度であるのか、実例をもって確認していきます。
ということで、まずは「非純正消耗品に関する重要なお知らせ」の裏面から。
これは DCP-J552N に同梱されていた半ペラの注意書きで、以下のようなものです。

非純正消耗品に関する重要なお知らせ

色はともかく、内容は大部分が文字で構成されており、複雑な段組みにも見えませんから、OCR の原稿としては、比較的好条件ではないかと思われます。
これを OCR にかけ、TEXT ファイルとして保存した内容が以下になります。

非純正消耗品に関する重要なお知らせ 裏面.txt

…まあ、それなりにはわかる、という程度には認識しています。

「BP71GLJ」を OCR

次は、今回試した中で一番ひどかった「BP71GLJ(DCP-J552N 付属の写真用光沢紙)」のパッケージ画像です。
裏面の認識結果文字列も大概ですが、表面に至っては、文字列としては一文字も認識できませんでした。

BP71GLJ 表面BP71GLJ 裏面

BP71GLJ 裏面.txt

その他 DCP-J552N のマニュアル等を OCR

以下、DCP-J552N のマニュアルその他をいくつか、適当に抜粋して試してみました。

かんたん設置ガイド P08

かんたん設置ガイド P08

かんたん設置ガイド P08.txt

安全にお使いいただくために P01

安全にお使いいただくために P01

安全にお使いいただくために P01.txt

安全にお使いいただくために P02

安全にお使いいただくために P02

安全にお使いいただくために P02.txt

安全にお使いいただくために P15

安全にお使いいただくために P15

安全にお使いいただくために P15.txt

まとめ

まあ、冒頭でも書いたことではありますが、この手の機能によって「自炊データの電子書籍化」といったことを行うのは、現状ではやはり、かなり厳しいと言わざるを得ません。
今のところ、現実的な用途としては、PDF に透明テキストとして認識文字を埋め込んでおき、蔵書リストの中に「確実にある」はずの資料を探すために全文検索をかけた際に「引っかかってくれればラッキー」程度の目的で使うのがせいぜいかな、と思います。

DCP-J552N 関連記事

関連記事

【同じタグを付けた記事の一覧】
ソフト紹介 画像管理 電子ブック DCP-J552N OCR

スポンサーサイト

コメントの投稿

非公開コメント

最新記事
最新コメント
Amazonおまかせリンク
カテゴリ
タグクラウド
Amazonお買い得ウィジェット
カレンダー
07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -
月別アーカイブ
プロフィール

電脳太助

Author:電脳太助
Website:電脳スピーチ web

RSSリンクの表示
メールフォーム

名前:
メール:
件名:
本文:

サイト内検索
Ads by Google
FC2アクセスランキング
Ads by Google
FC2拍手ランキング
ユーザータグ

音楽管理(66)
ポータブル(57)
ソフト紹介(44)
プログラミング(42)
音声技術(41)
自作ソフト(35)
サイト運営(32)
FC2(31)
ブログ(30)
iTunes(27)
Windows(25)
LISMO(24)
音声合成(23)
音声認識(22)
x-アプリ(22)
電子ブック(22)
eラーニング(20)
バックアップ(19)
語学学習(19)
foobar2000(18)
ソースコード(18)
WindowsLiveWriter(15)
画像管理(15)
C++(14)
アフィリエイト(10)
DnspTools(10)
fi-6130(9)
FLAC(9)
JavaScript(9)
ウォークマン(9)
英語音読学習計画(8)
Gracenote(8)
Prolog(8)
ベクター(8)
雑記(8)
CodeBlocks(7)
SyntaxHighlighter(7)
TraConv(7)
spcbght(7)
wxWidgets(7)
VirtualBox(6)
W63CA(6)
DCP-J552N(6)
WinRT(6)
WindowsLiveMesh(6)
iGoinLM(6)
英語発音矯正実験(6)
ExactAudioCopy(6)
MP3Gain(6)
LAME(5)
音楽技術(5)
Mery(5)
楽器演奏(5)
GalateaTalk(4)
nLite(4)
WindowsLiveSkyDrive(4)
ホームページ(4)
GalateaProject(4)
MIDI(4)
LLVM(4)
PC-98(3)
カウンター(3)
AACGain(3)
iTCDini(3)
OverCutChecker(3)
拍手(3)
PK-513L(3)
UniversalExtractor(3)
アクセスランキング(3)
ImageCompositeEditor(2)
アクセス解析(2)
OCR(2)
qtaacenc(2)
資格試験(1)
AquesTalk(1)
AquesCmdDl(1)

FC2アクセスランキング
最新トラックバック
アクセスランキング
[ジャンルランキング]
コンピュータ
135位
アクセスランキングを見る>>

[サブジャンルランキング]
ソフトウェア
16位
アクセスランキングを見る>>
FC2カウンター
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。