スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

【同じタグを付けた記事の一覧】

英語音声認識によるカタカナ発音の矯正実験を開始

2013年05月08日(水)00時58分

コンピュータの認識範囲⊂人間の認識範囲

前回「音声合成して音声認識するスクリプト」を公開しました。
そこでも書いているのですが、これはそもそも「外国語の正しい発音を習得する」ことを目的として作ったものです。
前提として、現時点において、コンピュータによる音声認識機能は、人間の音声認識能力にはるかに及ばない、ということがあります。
つまり下図のような関係であると考えられ、そうであるならば「コンピュータが認識可能=人間も認識可能」という式が成り立つと言えます。

音声認識の範囲(理想)

懸念

しかしながら、実際には下図のように、「コンピュータには認識できるが人間には認識できない部分」が存在します。

音声認識の範囲(懸念)

具体的には、コンピュータによる音声認識は、それが「音」であれば全て「言葉」とみなして処理しますので、例えば「咳払い」や「あくび」のような非音声でも、何かしらの文字列に無理やり変換してしまいます。
試しに今、「咳払い」をして確認してみたところ、「his」と認識されました。
ということは、文中に「his」という単語がある場合、そこを「咳払い」に換えても、「コンピュータには」正しく認識される可能性がある、ということになります。
もちろん、この「咳払い」のようなあからさまな雑音であれば、「正しい発音である」と勘違いして覚えることはまずありえないと思いますが、もっと微妙な、「声として出すことができ、コンピュータにも認識されるが、本来その言語には存在しない音素」のようなものがあることも十分に考えられます。
そして、もしそういう音が大量にあり、かつ、それらを「コンピュータが認識できるのだから正しい」として身に付けてしまったとすると、結局はネイティブに通じない「英語モドキ」を話すことになってしまいます。

被験者

というようなことから、この「音声認識を使用した発音練習」という方法が有効であるかどうかは、実際にその練習法を「誰か」に試してもらい、その効果を確認する必要があります。
その「誰か」は、これまでにその言語の発音に関する練習をしたり指導を受けたりしたことがなく、むしろ完全に間違った発音を大量に身に付けている、というような「誰か」です。
で、そう考えたとき、間違いなくうってつけの適任者は「自分である」ということに気づきました。
こと英語に関して言えば、自分は全くの不得意であり、おそらく自身の現在の英語能力は、さすがに中一レベルは超えていると信じたいところですが、高校入試を難なく突破できる(中三レベル)ほどは到底ありませんので、まあせいぜい、よくて中二レベルだと思われます。
そのため、これまでの人生では、できる限り英語を避け、使わずに済むよう逃げ回ってやり過ごしてきました。

…今、少し嘘を書きました。

本当のことを言えば、「英語が使えるようになりたい」という願望は常に抱いており、時々その「英語熱」が大きく燃え上がることもあったのですが、そういう時はいつも、参考書や問題集を買っただけで満足してしまい、「いつかそのうち本気出すから…」と手つかずのまま仕舞い込んで終了でした(よくある話です)。

確認実験開始

これまでずっとそんな調子でしたので、前回「音声合成して音声認識するスクリプト」を作っている時も、「いつか本気出す時のために」あるいは「どこかの誰かの役に立つかもしれない」という程度の認識で、実際にそれを使って自分自身が発音確認(または練習)を行うつもりは、全くありませんでした。
が、せっかくですので今回、この「音声認識で正しい発音を身に付ける」というお題を、英語学習も兼ねて、自分自身が挑戦してみることにしました。
今のところ考えているのは、日本語ネイティブである自分が、日本語音声認識を使用した際の認識率、つまり「(教科書的な文章であれば)せいぜい二度三度言い直せば認識させられる」という程度にまで英語発音能力を引き上げ、その状態で何か本でも朗読し、それを英語ネイティブな方に不自然でないかどうか確認してもらう、というようなことです。
ちなみに、今現在の自分には、発音チェックをお願いできるようなツテ、つまり英語ネイティブな友人知人等は全くいないのですが、まあ確認作業が必要になるレベルまでたどり着けるかも怪しいところですので、そのあたりの問題は、その時が来てから考えようと思います。

DUO 3.0

なお、実際の作業には「DUO 3.0」という参考書(単語集?)を使用します。

これは、その筋?では比較的有名な英語教材で、その特色を序文から抜粋しますと「現代英語の重要単語1600語と重要熟語1000語を重複なしで560本の英文に凝縮させました。」ということになります。
この特色が、今回の目的(あるいはやりたいこと)と非常に相性が良く、つまりこの「560本の英文」の音読をやり込めば、正しい発音の獲得と同時に重要単語・熟語も覚えることができ、まさに一石二鳥である、というのがこれを選んだ理由です。

…というのもありますが、実は以前に「英語熱」が高まった際に、この「DUO 3.0」と、さらに別売りの音声CD(「基礎用」と「復習用」の二種類)まで合わせて買った上、結局全く使わずに長いあいだ死蔵してあるため、「使わないともったいない」ということも大きな理由としてありました(ついでで告白しますと、これの以前の版である「DUO 2.0」とその音声CD二種も「新品同然の状態で」所蔵しています…)。
ということで、とりあえずはこの「560本の英文」を、「せいぜい二度三度言い直せば認識させられる」レベルになるまで頑張ってみようと思います。

…いつまで続くかはわかりませんが。

関連記事

【同じタグを付けた記事の一覧】
eラーニング 音声技術 語学学習 音声認識 英語発音矯正実験

スポンサーサイト

コメントの投稿

非公開コメント

最新記事
最新コメント
Amazonおまかせリンク
カテゴリ
タグクラウド
Amazonお買い得ウィジェット
カレンダー
07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -
月別アーカイブ
プロフィール

電脳太助

Author:電脳太助
Website:電脳スピーチ web

RSSリンクの表示
メールフォーム

名前:
メール:
件名:
本文:

サイト内検索
Ads by Google
FC2アクセスランキング
Ads by Google
FC2拍手ランキング
ユーザータグ

音楽管理(66)
ポータブル(57)
ソフト紹介(44)
プログラミング(42)
音声技術(41)
自作ソフト(35)
サイト運営(32)
FC2(31)
ブログ(30)
iTunes(27)
Windows(25)
LISMO(24)
音声合成(23)
音声認識(22)
x-アプリ(22)
電子ブック(22)
eラーニング(20)
バックアップ(19)
語学学習(19)
foobar2000(18)
ソースコード(18)
WindowsLiveWriter(15)
画像管理(15)
C++(14)
アフィリエイト(10)
DnspTools(10)
fi-6130(9)
FLAC(9)
JavaScript(9)
ウォークマン(9)
英語音読学習計画(8)
Gracenote(8)
Prolog(8)
ベクター(8)
雑記(8)
CodeBlocks(7)
SyntaxHighlighter(7)
TraConv(7)
spcbght(7)
wxWidgets(7)
VirtualBox(6)
W63CA(6)
DCP-J552N(6)
WinRT(6)
WindowsLiveMesh(6)
iGoinLM(6)
英語発音矯正実験(6)
ExactAudioCopy(6)
MP3Gain(6)
LAME(5)
音楽技術(5)
Mery(5)
楽器演奏(5)
GalateaTalk(4)
nLite(4)
WindowsLiveSkyDrive(4)
ホームページ(4)
GalateaProject(4)
MIDI(4)
LLVM(4)
PC-98(3)
カウンター(3)
AACGain(3)
iTCDini(3)
OverCutChecker(3)
拍手(3)
PK-513L(3)
UniversalExtractor(3)
アクセスランキング(3)
ImageCompositeEditor(2)
アクセス解析(2)
OCR(2)
qtaacenc(2)
資格試験(1)
AquesTalk(1)
AquesCmdDl(1)

FC2アクセスランキング
最新トラックバック
アクセスランキング
[ジャンルランキング]
コンピュータ
130位
アクセスランキングを見る>>

[サブジャンルランキング]
ソフトウェア
12位
アクセスランキングを見る>>
FC2カウンター
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。