スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

【同じタグを付けた記事の一覧】

ATH-770COM を購入

2011年11月26日(土)07時30分

音声認識

audio-technica のステレオヘッドセット、つまりマイク付きのヘッドホンである「ATH-770COM」を買いました。

この手の、本格的?なヘッドホンにマイクが付いているようなタイプのヘッドセットというのは、大体主としてオンラインのアクションゲームをプレイするユーザーの方が、ゲーム中の音声に耳を澄ましながら、協力プレイヤーと音声でチャットをする、といった用途で購入されているようです。
が、自分がこれを買った主な理由は、音声認識に使うためです。

ステレオヘッドセットが欲しい

Microsoft Haruka という無償かつなかなか高品質な日本語音声合成エンジンが公開されて以来、このブログではずいぶん「音声合成」に偏っていろいろと書いてきましたが、「Microsoft Speech Platform の日本語音声合成エンジン」でも少し触れている通り、「音声認識」という技術もかなり好きなジャンルなのです。
で、そろそろ「音声認識」の方でもいろいろ遊んでみようかと考え、そしてせっかくですから、そのために「良いマイクロホン」が欲しいなと思ったわけです。
それに加えて、以前より「今のより上等な」ヘッドホンが欲しかった、ということもあります。
ただ、ヘッドホンというのは買えば半永久的に使用できるというものでもなく、長く使っているとイヤーパッドの部分がボロボロになったり、断線なども意外にあったりして結構消耗品で、貧乏性の自分としては、3万とか5万とかはちょっと出せないため、予算は一万円程度を目途にしました。
ということで、「マイク部が優秀」「ヘッドホン部もそこそこ」「予算一万円程度」の3点を条件に検討した結果、最終候補に残ったのが ATH-770COM でした。

音声認識用のマイクロホンとしての ATH-770COM

音声認識においてマイクというのは非常に重要な要素です。
例えば Windows に標準で搭載されている音声認識機能は、「とても優秀」というほどではありませんが「使い物にならない」というほどひどくもありません。
もし「過去に試してみたがろくに認識しなかった」という経験を持っておられるなら、それは「マイクの性能」が問題であった可能性が高いです。
ただ、困ったことにこのマイク問題、こと音声認識に関しては「価格の高いものが正解」というわけではなく、例えば自分の経験から言うと、今回 ATH-770COM を買うまでは、ずいぶん前にワゴンセールで買った500円のチープなプラスチック製ヘッドセットが一番優秀でした。
逆に一番高価(といっても確か3千円ちょっと)だった USB ヘッドセットは、オーディオミキサーで最大値にしても、ブーストをかけても、どうやっても入力レベルが上がらず、認識率が低すぎて使い物になりませんでした。
その点でこの ATH-770COM、ネットでの事前調査では「マイクの感度が良く優秀である」という書き込みが多くあり、実際に試してみた感じでも、前述の一番優秀だったヘッドセットと同等か、それ以上の認識レベルを示しています。

音楽鑑賞用のヘッドホンとしての ATH-770COM

自分が過去これまでに使ってきたヘッドホンというのは全て、行った電気屋で「密閉型の一番安いもの」という選択基準で買ってきたものばかりでした。
以前「iTunes と音楽 CD で気軽に音質を ABX テストするスクリプト」において、「自分の耳がどの程度の性能か?」をテストした際に使ったのも、そのようにして買ってきたヘッドホンです。
その結果「自分の耳では 128kbps 程度までしか判別できない」ということが明らかになったわけですが、しかし心中密かに、「もっといいヘッドホンを使ったならあるいは…」と思っていたことも確かです。
ということで「もっといいヘッドホン」を条件に加えるも、何をもって「いい」とするかが問題となります。
試聴して聴き比べるのが本筋ですが、ステレオヘッドセットの試聴機などそうそうありませんし、そもそも「聞き比べて判断できるほどの耳か?」というところからして問題があるわけです。
なので「スペック」の部分、つまり再生周波数帯域といった数値を参考に選ぶことにしました。
大体一昔前の安物ヘッドホンは、この数値が「20 ~ 20,000Hz」といったところで、ATH-770COM は「10 ~ 24,000Hz」、今使っているものよりも確実に広く、同価格帯の他の候補と比較しても優秀な部類でした。
もちろん、ちょっと検索すれば「数値はメーカーによって基準がまちまちで当てにならない」とか、「数値が良いからといって音がいいというわけではない」といった意見も散見され、それはもっともだと思いますが、他に手がかりもないので仕方がありません。

密閉型と ATH-770COM とループバック

あとヘッドホンに関してはもう一つ、PC を使用しているときは大体音楽を流していますので、「音楽を聴きながら音声入力をする」ことになるのですが、そうするとヘッドホン部分には、音漏れの少ない「密閉型」という条件が加わることになります。
ですので当然 ATH-770COM は「密閉型」ですが、ちょっと大きめの音量で音楽を聴きながらマイクのテストをしていると、わずかながらマイクの方へループバック(ヘッドホン部の音がマイクに流れ込む)していました。
といっても、音声編集ソフトでノーマライズをかけて音量を稼ぎ、さらに大音量で聞いて、それでやっと「背景にわずかにリズムが刻む音が入ってるな」とわかる程度で、音声認識に影響を与えるほどのものではありませんが。

ABX テスト(128kbps)

「再生周波数帯域が広いのだから良いに違いない」だけでなく、一応試して実際にどうなのかを確認しておこう、ということで、再度 ABX テストを行ってみました。
条件は前回の「iTunes と音楽 CD で気軽に音質を ABX テストするスクリプト」と全く同じで、という予定でしたが、無圧縮と 128kbps との区別に関しては「なんとなくわかってしまった」ため、半分の8回しか試行しておりません。
そして正解率は「100%」、完璧でした。
前回はせいぜい七割程度であったことを考えれば、やはり安物ヘッドホンよりも高い表現能力を有しているといえます(まあ当然と言えば当然なのですが)。

■iTunes 9.0.1.8 でのABXテスト結果
[対象形式]
	・A:WAVE(1411kbps/44100Hz)
	・B:MP3-LAME(128kbps/44100Hz/-b 128 --noreplaygain)
[有効試行回数]
	・8回(全8回)
[正解率]
	・100.00%(08/08)
[χ2分布]
	・  0.47%(08/08)
[試聴曲(末尾は再生回数)]
	・01.[Michael Jackson](Blood On The Dance Floor: HIStory In The Mix)08 2 Bad (Refugee Camp Mix)(163回)
■回別正誤成績
[有効数(通算数).○×:正解率% χ2分布% 正/計]
	・01(01).○:100.00%  31.73% 01/01
	・02(02).○:100.00%  15.73% 02/02
	・03(03).○:100.00%   8.33% 03/03
	・04(04).○:100.00%   4.55% 04/04
	・05(05).○:100.00%   2.53% 05/05
	・06(06).○:100.00%   1.43% 06/06
	・07(07).○:100.00%   0.82% 07/07
	・08(08).○:100.00%   0.47% 08/08
■解説
※正解率は高いほどよく、50%付近の場合は区別が出来ていないことになります。
50%を大きく下回る場合は区別が出来ていて操作を間違っている可能性があります。
※χ2分布は低いほど区別が出来ていることを示します。
統計学的には5%以下(より厳密な調査では1%以下)で区別が出来ているとみなすそうです。

ABX テスト(256kbps)

「無圧縮と 128kbps」が完璧であったことを受け、「無圧縮と 256kbps」でもテストしてみました。
これは前回、見事に「50%」、すなわち完全にあてずっぽうでまったく区別できていない、という結果に終わったものです。
そして今回の結果は「62%」、約六割といったところでした。
…前回よりいくらか上昇しているとはいえ、この程度であれば誤差の範囲内であるため、やはり残念ながら、「判別できる」といえるほどの耳を自分は持ち合わせていないようです。

■iTunes 9.0.1.8 でのABXテスト結果
[対象形式]
	・A:WAVE(1411kbps/44100Hz)
	・B:MP3-LAME(256kbps/44100Hz/-b 256 --noreplaygain)
[有効試行回数]
	・16回(全16回)
[正解率]
	・ 62.50%(10/16)
[χ2分布]
	・ 31.73%(10/16)
[試聴曲(末尾は再生回数)]
	・01.[Michael Jackson](Blood On The Dance Floor: HIStory In The Mix)08 2 Bad (Refugee Camp Mix)(110回)
	・02.[Michael Jackson](Blood On The Dance Floor: HIStory In The Mix)06 Scream Louder (Flyte Tyme Remix)(154回)
■回別正誤成績
[有効数(通算数).○×:正解率% χ2分布% 正/計]
	・01(01).○:100.00%  31.73% 01/01
	・02(02).○:100.00%  15.73% 02/02
	・03(03).○:100.00%   8.33% 03/03
	・04(04).×: 75.00%  31.73% 03/04
	・05(05).×: 60.00%  65.47% 03/05
	・06(06).×: 50.00% 100.00% 03/06
	・07(07).○: 57.14%  70.55% 04/07
	・08(08).×: 50.00% 100.00% 04/08
	・09(09).○: 55.56%  73.89% 05/09
	・10(10).○: 60.00%  52.71% 06/10
	・11(11).○: 63.64%  36.57% 07/11
	・12(12).○: 66.67%  24.82% 08/12
	・13(13).×: 61.54%  40.54% 08/13
	・14(14).○: 64.29%  28.50% 09/14
	・15(15).×: 60.00%  43.86% 09/15
	・16(16).○: 62.50%  31.73% 10/16
■解説
※正解率は高いほどよく、50%付近の場合は区別が出来ていないことになります。
50%を大きく下回る場合は区別が出来ていて操作を間違っている可能性があります。
※χ2分布は低いほど区別が出来ていることを示します。
統計学的には5%以下(より厳密な調査では1%以下)で区別が出来ているとみなすそうです。
関連記事

【同じタグを付けた記事の一覧】
音声技術 音楽管理 音声認識 iTunes

スポンサーサイト

コメントの投稿

非公開コメント

最新記事
最新コメント
Amazonおまかせリンク
カテゴリ
タグクラウド
Amazonお買い得ウィジェット
カレンダー
09 | 2017/03 | 10
- - - 1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31 -
月別アーカイブ
プロフィール

Author:電脳太助
Website:電脳スピーチ web

RSSリンクの表示
メールフォーム

名前:
メール:
件名:
本文:

サイト内検索
Ads by Google
FC2アクセスランキング
Ads by Google
FC2拍手ランキング
ユーザータグ

音楽管理(65)
ポータブル(57)
ソフト紹介(44)
プログラミング(42)
音声技術(41)
自作ソフト(34)
サイト運営(32)
FC2(31)
ブログ(30)
iTunes(26)
Windows(25)
LISMO(24)
音声合成(23)
音声認識(22)
x-アプリ(22)
電子ブック(22)
eラーニング(20)
バックアップ(19)
語学学習(19)
foobar2000(18)
ソースコード(17)
画像管理(15)
WindowsLiveWriter(15)
C++(14)
アフィリエイト(10)
DnspTools(10)
ウォークマン(9)
fi-6130(9)
FLAC(9)
Gracenote(8)
英語音読学習計画(8)
Prolog(8)
JavaScript(8)
ベクター(8)
雑記(8)
CodeBlocks(7)
SyntaxHighlighter(7)
TraConv(7)
wxWidgets(7)
spcbght(7)
DCP-J552N(6)
W63CA(6)
MP3Gain(6)
WinRT(6)
iGoinLM(6)
VirtualBox(6)
WindowsLiveMesh(6)
英語発音矯正実験(6)
ExactAudioCopy(6)
楽器演奏(5)
Mery(5)
LAME(5)
音楽技術(5)
GalateaProject(4)
LLVM(4)
nLite(4)
MIDI(4)
ホームページ(4)
WindowsLiveSkyDrive(4)
GalateaTalk(4)
PC-98(3)
カウンター(3)
AACGain(3)
iTCDini(3)
OverCutChecker(3)
拍手(3)
PK-513L(3)
UniversalExtractor(3)
アクセスランキング(3)
ImageCompositeEditor(2)
アクセス解析(2)
OCR(2)
qtaacenc(2)
資格試験(1)
AquesTalk(1)
AquesCmdDl(1)

FC2アクセスランキング
最新トラックバック
アクセスランキング
[ジャンルランキング]
コンピュータ
113位
アクセスランキングを見る>>

[サブジャンルランキング]
ソフトウェア
12位
アクセスランキングを見る>>
FC2カウンター
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。