スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

【同じタグを付けた記事の一覧】

Windows 10 Technical Preview の音声合成と音声認識

2014年11月17日(月)00時22分

Win10TP の SAPI5 エンジン

前回Windows 10 Technical Preview(以下「Win10TP」)をインストールしてみましたので、ついでに SAPI5(音声合成・音声認識プラットフォーム)の状況について調べてみました。
その結果、おそらく現状では Win8 と変わりはないようで、つまり今回のタイトルは「Win8 の音声合成と音声認識」としても、そう違いはないと思われます。

音声合成エンジン

まず、音声合成エンジンですが、以下の三つがインストールされています(個別項目にてサンプル音声)。

  • Microsoft David Desktop - English (United States)
  • Microsoft Zira Desktop - English (United States)
  • Microsoft Hazel Desktop - English (Great Britain)

自分は Win7 からですので、「男性英語話者が増えている!」と思ったのですが、調べてみるとどうも David Desktop は Win8 時代から存在するようで、つまり変化は特にないということになります。
もちろん、内部的に何かしら改善されている可能性はないとは言えませんが。

音声認識エンジン

次に音声認識ですが、以下の一つがインストールされています。

  • Microsoft Speech Recognizer 8.0 for Windows (English - US)

…この「バージョン 8.0」というのは Vista も Win7 も Win8 も同一で、つまりもう長いあいだずっと変わっていません。
もはや「クラウド」の時代で、MicrosoftBing で音声認識機能を提供していますし、「今更ローカルのエンジンにリソースを割くような無駄なことはしない」ということなのかもしれません。

Microsoft David

個別にみていきますと、まず Microsoft David です。
音声合成界では何故か、世界的に「女性音声」の勢力が強いため、そういう意味で貴重な「男性音声」です。
ただこの David、別に Win10TP で新規に追加されたわけではなく、Win8 の頃から居たそうで、日本語版には標準では存在しないものの、英語の言語パックを追加適用することで使えるようになるらしいです。
登場時期から考えて、Microsoft Zira のパートナー的な位置づけとして開発されたのであろうと思われますし、その品質も「Microsoft Zira 相当」、つまりはそれなりに高いことが期待されます。
ということで、とりあえず例のごとく?「不思議の国のアリス」の冒頭部分を読み上げさせた MP3 ファイルを作ってみました。

比較の対象としては、以前に「Microsoft Speech Platform 11 の追加音声」や「Microsoft Speech Platform の日本語音声合成エンジン」で、他の英語話者で作った MP3 ファイルを公開しています。

Microsoft Zira

この「Microsoft Zira」は、名前から考えても、Microsoft Speech Platform(以下「MSSP」)の「Microsoft ZiraPro」と同じものだと思われます。
そもそも、MSSP の話者はすべて「普通の人名」的な名前が付けられており、「ZiraPro」のみが異質な存在でしたので、他に合わせて改名されたのでしょう。
一応、同じものであろうとは思いながらも、念のためにサンプルの MP3 ファイルを作ってみました。

で、「ZiraPro の MP3 ファイル」と聴き比べてみましたが、まあ同じです。
なお、「Microsoft ZiraPro」については「Microsoft Speech Platform 11 の追加音声」で言及しています。

Microsoft Hazel

これはもう、名前もそのままですので、MSSP のイギリス英語話者である「Microsoft Hazel」と同じだと思います。

日本語話者は?

Win10TP は今のところ「英語版」「中国語版」「ポルトガル語版」のみが出ています。
ですので、「日本語話者」は追加もできませんし、現時点では確認のしようもないわけですが、ただまあ、Microsoft Hazel の例を見る限り、おそらくは「Microsoft Haruka」がそのまま載ってくるのであろうと思います。

Windows ストアアプリと音声処理機能

ついでに、というべきか自分にとってはこちらが本命なのですが、Windows ストアアプリにおいてはどのような扱いであるのかを調べてみたところ、「Win8 では使用不可、Win8.1 で音声合成のみ使用可能」という状況のようです。
いわく、Win8.1 になって「Windows.Media.SpeechSynthesis」なる名前空間が追加され、これを使用することで音声合成が可能になるとのこと。
しかしその音声合成は、「話者選択と合成音声の生成」しかできないようで、本当に「最低限のサポート」という感じになっています。
実際のところ、自分がしてみたかったのは、例えば単語登録といった「SAPI5 の音声合成機能に関するもう少し突っ込んだ使い方」だったのですが、この様子ではどうにも試しようがないようです。
また、音声認識に至っては、前述のように「Bing を使ってください」ということで、せっかくローカルに存在する SAPI5 の音声認識機能の使用方法が提供されていません。
とはいえまあ、音声認識は音声合成よりもなお、「大量の音声情報を集め、解析し、常に精度を上げていく」といったことが求められますので、「クラウド経由で」となるのも、やむを得ない流れなのかもしれません。

関連記事

【同じタグを付けた記事の一覧】
Windows WinRT 音声技術 音声合成 音声認識

スポンサーサイト

コメントの投稿

非公開コメント

最新記事
最新コメント
Amazonおまかせリンク
カテゴリ
タグクラウド
Amazonお買い得ウィジェット
カレンダー
09 | 2017/10 | 11
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31 - - - -
月別アーカイブ
プロフィール

電脳太助

Author:電脳太助
Website:電脳スピーチ web

RSSリンクの表示
メールフォーム

名前:
メール:
件名:
本文:

サイト内検索
Ads by Google
FC2アクセスランキング
Ads by Google
FC2拍手ランキング
ユーザータグ

音楽管理(66)
ポータブル(57)
ソフト紹介(44)
プログラミング(42)
音声技術(41)
自作ソフト(35)
サイト運営(32)
FC2(31)
ブログ(30)
iTunes(27)
Windows(25)
LISMO(24)
音声合成(23)
音声認識(22)
x-アプリ(22)
電子ブック(22)
eラーニング(20)
バックアップ(19)
語学学習(19)
foobar2000(18)
ソースコード(18)
WindowsLiveWriter(15)
画像管理(15)
C++(14)
アフィリエイト(10)
DnspTools(10)
fi-6130(9)
FLAC(9)
JavaScript(9)
ウォークマン(9)
英語音読学習計画(8)
Gracenote(8)
Prolog(8)
ベクター(8)
雑記(8)
CodeBlocks(7)
SyntaxHighlighter(7)
TraConv(7)
spcbght(7)
wxWidgets(7)
VirtualBox(6)
W63CA(6)
DCP-J552N(6)
WinRT(6)
WindowsLiveMesh(6)
iGoinLM(6)
英語発音矯正実験(6)
ExactAudioCopy(6)
MP3Gain(6)
LAME(5)
音楽技術(5)
Mery(5)
楽器演奏(5)
GalateaTalk(4)
nLite(4)
WindowsLiveSkyDrive(4)
ホームページ(4)
GalateaProject(4)
MIDI(4)
LLVM(4)
PC-98(3)
カウンター(3)
AACGain(3)
iTCDini(3)
OverCutChecker(3)
拍手(3)
PK-513L(3)
UniversalExtractor(3)
アクセスランキング(3)
ImageCompositeEditor(2)
アクセス解析(2)
OCR(2)
qtaacenc(2)
資格試験(1)
AquesTalk(1)
AquesCmdDl(1)

FC2アクセスランキング
最新トラックバック
アクセスランキング
[ジャンルランキング]
コンピュータ
126位
アクセスランキングを見る>>

[サブジャンルランキング]
ソフトウェア
13位
アクセスランキングを見る>>
FC2カウンター
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。