スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

【同じタグを付けた記事の一覧】

Windows の音声認識に自動学習機能?

2013年06月11日(火)01時08分

結論

以下、長々と書きましたが、結論から先に書きますと、おそらく自動学習的な機能はないであろう、と。

【追記:2013/06/23】「続・Windows の音声認識に自動学習機能?」において、やはり「ある」という結論に達しました。

第一文の成功

ここしばらく、Windows の英語音声認識機能を使用してカタカナ発音を矯正する実験をしています、ということを書いていますが、まだ続けています(タグ:英語発音矯正実験)。
で、その後「will」の認識率も徐々に向上し、また、前回「英語発音矯正実験 第一文」では「ただの一度も成功したことがない」と書いた「individual」も、ある日突然(時々ですが)認識されるようになり、そしてついに数日前、「We must respect the will of the individual.」の完全な一文を見ることに成功しました。
といっても、本当に「偶然」「まぐれで」「運よく」一度だけベストな発音が集中したことによる成功で、これを持ってこの文を「クリアした」というのは無理がありますが、それでも、とりあえずは完成させることができました。

疑問

ただ、不思議なのは、これまで全く認識不能だったのもが、ある日突然認識され始めることです。
「毎日練習しているのだから当たり前ではないか」と思われるかもしれません。
確かにそうなのですが、納得がいかないのは、自分自身、「成功したとき」と「成功しなかったとき」で、どこが違うのかさっぱりわかっていない、という点です。
むしろ自分としては、「発音の仕方が変わった」とか「コツをつかんだ」というようなことはなく、これまでと特に違わないにもかかわらず、なぜか突然認識され始める、といった感覚なのです。

自動学習機能?

それで、もしかして Windows の音声認識機能には、自動学習機能のようなものが搭載されているのではないか?と不安になりました。
つまり、別に自分の発音能力が向上しているわけではなく、認識エンジンがこちらの発音に合わせて変化してくれているのではないか、ということです。
もしそうであれば、この「英語発音矯正実験」の方法では、望みの結果(発音能力の向上)を得ることができない、ということになってしまいます。

学習不可能?

しかし、理屈で言えば、発音を「自動学習」するためには「発音サンプル」と「正解文」が必要ではないか?とも考えました。
つまり、ある音声に対し、何らかの認識結果を返したとして、それが正解だったかどうかを認識エンジン側が知ることができなければ、修正のしようがないのではないか、と。
とはいうものの、何しろ自分などよりはるかに頭が良いであろう技術者の方々が作っているものですから、何か自分では考えもつかないようなうまい方法があるのかもしれません。

確認実験

などと考えていたところで答えは出ませんので、実験して確かめることにしました。
方法は、まず過去に「Windows の音声認識を JavaScript で(録音再生編)」で作ったスクリプトを改造し、認識文先頭が「we must respect the will」になった音声のみ、WAVE ファイルとして保存するようにしました(「individual」はまだまだ確率が低く成功を待っていられないため)。
で、マイクに向かって「We must respect …」を数百回唱え続け、とりあえず成功文 50 個の WAVE ファイルを集めました。
そしてその成功ファイルを、仮想 PC に新規インストールした Win7x86 環境に持っていき、今度は「Windows の音声認識を JavaScript で(WAVE ファイル入力編)」で作ったスクリプトを使って、まとめて認識させました。
これは、新規インストールですから、もし学習機能があったとしても、何も学習されていない状態のはずです。
また、比較対象として、現在使用中の(マイク録音による元ファイル生成に使用した)Win7x64 環境と、以前使っていたノート PC の Vista 環境でも「WAVE ファイル認識」させてみました。
なお、当然ですが、現在使用中の Win7x64 環境を含め、認識精度を上げるためのトレーニング(特定ユーザーに合わせたプロファイルの作成)はしておらず、「既定の音声プロファイル」を使用しています。

実験結果

で、その結果は以下の通りとなりました。

  must respect will individual
学習済?Win7x64でマイク入力 50 50 50 1
学習済?Win7x64でWAVE認識 49 47 30 5
未学習Win7x86でWAVE認識 22 38 22 0
未学習VistaでWAVE認識 13 43 15 0

最上段はマイク入力時の認識結果で、当然ながら「must」「respect」「will」は 50 個完璧に認識されています(というより認識されたときのみ採用していますので)。
そして、絶対に学習されていない「はず」の下二段ですが、これが微妙です。
確かに認識率はかなり落ちています。
が、以前「音声合成して音声認識するスクリプト」で書いた通り、本当に未学習の状態で、こちらの発音能力が全く向上していないとすると、「全く完全に部分一致すらしない」という結果となるはずです。
しかしながら結果として、いまだに相当に苦労し、認識率の低い単語「will」ですら、そこそこに認識されていますので、学習機能が絶対にないとは言い切れませんが、少なくとも自分の発音能力が上がっているのには間違いないようです。

認識率の劇的な向上と追加実験

今回の実験のため、Vista 入りの古いノート PC を引っ張り出してきました。
それで、せっかくですので、現在 Win7x64 入り自作 PC に繋いでいるヘッドセットマイク「ATH-770COM」を、この Vista ノート PC に繋ぎ換え、音声認識させてみたところ、認識成功率が何故か劇的に向上しました。

なんと二~三回に一回程度の割合で、「We must respect the will of the individual.」の完成形を見ることができるのです。
で、その録音結果を使用して、またそれぞれ別の環境で WAVE ファイル認識を試した結果が以下の表です。

  must respect will individual
未学習Vistaでマイク入力 50 50 50 20
学習済?Win7x64でWAVE認識 31 13 15 41
未学習Win7x86でWAVE認識 8 33 20 34
未学習VistaでWAVE認識 50 50 50 30

これまた微妙な結果ではあるものの、ほぼ完全に未学習であるはずの Vista で高い成功率が確認できたことから、少なくとも自身の発音能力は相当に向上しているものと思われます。
つまり、今回の学習方法は、自分自身何が変わっているのか意識できないながらも、一応何かしらの(良い方向への)変化は起こっており、その意味で成功しているといえます。

自分、不器用ですから…

これまでいろいろと試してきた経験を通し、自分はどうにも不器用なタイプである、と強く自覚していました。
少なくとも、こういう「体で覚える」といった類の、「無意識の領域で学習し、知らず知らずに少しずつ上達していく」といった能力は、自分には全く備わっていないと考えていたのです。
しかし、今回のことを見る限りでは、単に「それが他人よりもものすごく遅い」というだけで、「そういう能力自体がない」わけでもないように思えます。
つまりまあ、今までそう思い込んでいたのは、どうにもこれまでは「忍耐力が足りなかった」ということになるわけですが。
ともかく、例え数百回や数千回では結果が出なくとも、さすがに数万回も繰り返せば、不器用なりに「そういう能力」の恩恵を受けることもできる…、「かもしれない」ということがわかり、これは自分にとって、もう少しこの路線で粘ってみてもいいかと思える程度には、うれしい結果だといえます。

関連記事

【同じタグを付けた記事の一覧】
音声技術 語学学習 音声認識 英語発音矯正実験

スポンサーサイト

コメントの投稿

非公開コメント

最新記事
最新コメント
Amazonおまかせリンク
カテゴリ
タグクラウド
Amazonお買い得ウィジェット
カレンダー
07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -
月別アーカイブ
プロフィール

電脳太助

Author:電脳太助
Website:電脳スピーチ web

RSSリンクの表示
メールフォーム

名前:
メール:
件名:
本文:

サイト内検索
Ads by Google
FC2アクセスランキング
Ads by Google
FC2拍手ランキング
ユーザータグ

音楽管理(66)
ポータブル(57)
ソフト紹介(44)
プログラミング(42)
音声技術(41)
自作ソフト(35)
サイト運営(32)
FC2(31)
ブログ(30)
iTunes(27)
Windows(25)
LISMO(24)
音声合成(23)
音声認識(22)
x-アプリ(22)
電子ブック(22)
eラーニング(20)
バックアップ(19)
語学学習(19)
foobar2000(18)
ソースコード(18)
WindowsLiveWriter(15)
画像管理(15)
C++(14)
アフィリエイト(10)
DnspTools(10)
fi-6130(9)
FLAC(9)
JavaScript(9)
ウォークマン(9)
英語音読学習計画(8)
Gracenote(8)
Prolog(8)
ベクター(8)
雑記(8)
CodeBlocks(7)
SyntaxHighlighter(7)
TraConv(7)
spcbght(7)
wxWidgets(7)
VirtualBox(6)
W63CA(6)
DCP-J552N(6)
WinRT(6)
WindowsLiveMesh(6)
iGoinLM(6)
英語発音矯正実験(6)
ExactAudioCopy(6)
MP3Gain(6)
LAME(5)
音楽技術(5)
Mery(5)
楽器演奏(5)
GalateaTalk(4)
nLite(4)
WindowsLiveSkyDrive(4)
ホームページ(4)
GalateaProject(4)
MIDI(4)
LLVM(4)
PC-98(3)
カウンター(3)
AACGain(3)
iTCDini(3)
OverCutChecker(3)
拍手(3)
PK-513L(3)
UniversalExtractor(3)
アクセスランキング(3)
ImageCompositeEditor(2)
アクセス解析(2)
OCR(2)
qtaacenc(2)
資格試験(1)
AquesTalk(1)
AquesCmdDl(1)

FC2アクセスランキング
最新トラックバック
アクセスランキング
[ジャンルランキング]
コンピュータ
130位
アクセスランキングを見る>>

[サブジャンルランキング]
ソフトウェア
12位
アクセスランキングを見る>>
FC2カウンター
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。