スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

【同じタグを付けた記事の一覧】

Microsoft Sam にカナを読み上げさせるスクリプト

2010年07月21日(水)23時50分

英語合成エンジンと発音文字とカナ読み上げ

Windows XP 以上の OS には英語の音声合成エンジンが標準で搭載されており、英語であれば別にソフトをインストールしたりせずとも読み上げさせることができます。
その合成エンジン「Microsoft Sam(Vista 以降では Anna)」には読み(発音)を発音記号的な文字セットで直接指定する方法があり、例えば「<pron sym = "h eh l ow"/>」と書くと「ハロー」と読み上げます。
これを利用して、カナをこの「発音文字」で直接指定して発音させてやれば、ローマ字表記や、発音の似た英単語を並べるより、自然で手間のかからない日本語読み上げができるのではないか?という思い付きから作ってみたのが今回のスクリプトです。

まずは結果から

思いついた時には「これは結構いいものができるのでは!」とも思ったものですが、出来上がってみるとたいしたものにはなりませんでした。
百聞は一聴にしかず、というわけでサンプルです。

Sam の方はいくらかマシですが、Anna は何を言っているのかわからないレベルです。
これは発音調整を Sam の方でやったから、ということもあるかもしれませんが、根本的に個々の音声パーツが今回の目的に向いてないように思えます。
また、Anna のバグ?なのかピリオドによる無音が一文字後ろに食い込んでしまう現象があって、そのせいでより不自然になってます。
実は試した中では、Microsoft 社が最近公開した新しい音声合成システムの英語話者(Helen)を使ったものが一番良かったのですが、そこまでするのなら同時に公開された日本語話者(Haruka)を使えば…、という話もあります(参考「Microsoft Speech Platform の日本語音声合成エンジン」)。

それでもまあ、せっかく作ったものですので、「カナ文章を MP3 ファイルに保存する」までの手順を説明していきたいと思います。

【準備1】「DnspTools」フォルダを作る

まだ「DnspTools」フォルダをお作りでない場合は、こちらのページを参考にして「DnspTools」フォルダを作っておいてください。
今回は「DnspTools」フォルダを最後まで完成させる必要はなく、【手順4】(MP3Gain の準備)まででかまいませんので、早ければ3分程度で終わる簡単な作業です。

DnspTools 

【準備2】「MSSamJpn.txt」のダウンロード

MSSamJpn.txt ← 矢印左側の文字の上で右クリックし、「対象をファイルに保存(A)…」して保存先フォルダを開きます。

MSSamJpn対象をファイルに保存 

【注目】ここでファイル名「MSSamJpn.txt」の最後3文字「txt」を、「bat」(半角英小文字)に変更し「MSSamJpn.bat」とします。

MSSamJpn名前を付けて保存1 MSSamJpn名前を付けて保存2

MSSamJpnダウンロードの完了 

ダウンロードした「MSSamJpn.bat」を「切り取り」し、「DnspTools」フォルダに「貼り付け」ます。

MSSamJpn切り取り MSSamJpn貼り付け

DnspTools」フォルダの「MSSamJpn.bat」を右クリックし、「プロパティ」を見て、「ブロックの解除」ボタンがあれば押して「OK」します。

MSSamJpnプロパティ MSSamJpnブロックの解除

【準備3】拡張子の変更

もし【準備2】で拡張子「txt」を「bat」に替え忘れていた場合はここで変えます。「MSSamJpn.txt」を右クリックし「名前の変更」します。

MSSamJpn名前の変更 

ファイル名「MSSamJpn.txt」の最後3文字「txt」を、「bat」(半角英小文字)に変更し「MSSamJpn.bat」とします。

MSSamJpn拡張子の変更1 MSSamJpn拡張子の変更2

拡張子を変更すると警告が出ますので「はい」します。

MSSamJpn拡張子の警告 

【手順1】起動

DnspTools」フォルダの「MSSamJpn.bat」を実行します。

MSSamJpn実行

MSSamJpn.bat」が起動します。

MSSamJpn起動

【手順2】使い方

上のテキストエリアに英数カナで読ませたい文字を入力し、「発音文字化」し、「再生」します。

MSSamJpn使い方

【手順3】録音

必要に応じて画面下部のタグ文字列を埋め、「MP3」をチェックし、ファイル名を指定し、「録音」します。

MSSamJpn録音

録音先フォルダを指定し、「OK」し、しばらく待ちます。

MSSamJpnフォルダーの参照

以下のダイアログが表示されれば録音成功です。

MSSamJpn録音成功

アンインストール

レジストリの変更もINIファイルの生成もしませんので、「MSSamJpn.bat」を削除するだけです。

使い道

まあ、無料で使える日本語音声合成エンジンが登場した今となっては、実用的な使い道はあまりないと思いますが、YouTubeニコニコ動画に投稿する動画作りに「似非外国人風のカタコト日本語のセリフが欲しい」というような場合には役に立つかもしれません。
一応、拙作「iTunes で再生時に曲名・歌手名を読み上げるスクリプト」で使用しています(というよりもともとこれ用に作った関数を流用して作ったのが今回のスクリプトですが)。

関連記事

【同じタグを付けた記事の一覧】
自作ソフト DnspTools ポータブル 音声技術 音声合成

スポンサーサイト

コメントの投稿

非公開コメント

日本語合成音声エンジンについて

電脳太助さん、はじめまして

cx20 と申します。

SAPI のサンプルコードを検索していたら、このページにたどり着きました。
いつの間にか、Windows 7/Vista でも使用できる日本語合成音声エンジンが公開されていたんですね。

偶然ですが、自分も、Microsoft Anna に日本語をしゃべらせることができないか?と思い、
昔、↓こんなのを作りました。

http://javascript.g.hatena.ne.jp/cx20/20090224

SAPI で発音指定ができるとは知らず、空耳英語に変換するという無茶なことをしてたりします(汗)
あまり参考にならないかと思いますが、興味がありましたらどうぞ。

Re: 日本語合成音声エンジンについて

はじめまして、cx20さん。

さっそくサイトを拝見させていただきました。
やっぱり「英語がしゃべれる」「でも英語しかしゃべれない」となるとついやっちゃいますよね?
同好の士?にお会いできてうれしく思います。

で、発音指定方式なんですが、思いついたときは「これはいける!」って感じだったんですが、
子音と母音の組み合わせで作れる分、完成までの手間が省けたという利点はあったものの、
いざ完成してみると発音の自然さや聴きやすさの点では今一つな感じで…。

空耳方式は、SAPIの機能に依存しないので汎用的に使えるはずですし、
「英単語」の発音が元なだけにエンジンの個性による幅も少なそうな点がいいですね。
それに「英単語」だけに発音の予想がつけやすい分、
ネットなんかでの発音チューニング・データの募集的なことがしやすそうなのもポイント高いです。
やはりこのネタはチューニングの出来がかなりのウエイトを占めるように感じましたので。

日本語音声合成エンジンが公開されたとはいえ、標準機能で使えるという点で、
日本語→英語発音変換方式もいいものができれば需要はありそうなんですが。
もっとも需要といっても音声合成というジャンル自体が、世間的にはネタ的な扱いで、
しかも相当にマイナーっぽいのが、音声認識・合成のファンとして間残念なところです。
確かに実用性は高いとは言えないので、何作っても一発芸的な範囲をなかなか超えないんですけども。
面白いと思うんですけどね…。

それでは、また。

No title

電脳太助さん

返信ありがとうございます。

音声合成は、やっぱりネタ的な使われ方が多いですよね。
個人的にはペンタックスの音声合成エンジンがわりといい感じです。
これくらいのレベルのものが OS 標準でついてたらもっと使う人が増えるんじゃないかなぁ?と思います。

■音声合成ソフトウェア VoiceText
http://voicetext.jp/

また機会がありましたら、コメントを書かせていただくこともあるかと思いますが、そのときはよろしくお願いします。
最新記事
最新コメント
Amazonおまかせリンク
カテゴリ
タグクラウド
Amazonお買い得ウィジェット
カレンダー
07 | 2017/08 | 09
- - 1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31 - -
月別アーカイブ
プロフィール

電脳太助

Author:電脳太助
Website:電脳スピーチ web

RSSリンクの表示
メールフォーム

名前:
メール:
件名:
本文:

サイト内検索
Ads by Google
FC2アクセスランキング
Ads by Google
FC2拍手ランキング
ユーザータグ

音楽管理(66)
ポータブル(57)
ソフト紹介(44)
プログラミング(42)
音声技術(41)
自作ソフト(35)
サイト運営(32)
FC2(31)
ブログ(30)
iTunes(27)
Windows(25)
LISMO(24)
音声合成(23)
音声認識(22)
x-アプリ(22)
電子ブック(22)
eラーニング(20)
バックアップ(19)
語学学習(19)
foobar2000(18)
ソースコード(18)
WindowsLiveWriter(15)
画像管理(15)
C++(14)
アフィリエイト(10)
DnspTools(10)
fi-6130(9)
FLAC(9)
JavaScript(9)
ウォークマン(9)
英語音読学習計画(8)
Gracenote(8)
Prolog(8)
ベクター(8)
雑記(8)
CodeBlocks(7)
SyntaxHighlighter(7)
TraConv(7)
spcbght(7)
wxWidgets(7)
VirtualBox(6)
W63CA(6)
DCP-J552N(6)
WinRT(6)
WindowsLiveMesh(6)
iGoinLM(6)
英語発音矯正実験(6)
ExactAudioCopy(6)
MP3Gain(6)
LAME(5)
音楽技術(5)
Mery(5)
楽器演奏(5)
GalateaTalk(4)
nLite(4)
WindowsLiveSkyDrive(4)
ホームページ(4)
GalateaProject(4)
MIDI(4)
LLVM(4)
PC-98(3)
カウンター(3)
AACGain(3)
iTCDini(3)
OverCutChecker(3)
拍手(3)
PK-513L(3)
UniversalExtractor(3)
アクセスランキング(3)
ImageCompositeEditor(2)
アクセス解析(2)
OCR(2)
qtaacenc(2)
資格試験(1)
AquesTalk(1)
AquesCmdDl(1)

FC2アクセスランキング
最新トラックバック
アクセスランキング
[ジャンルランキング]
コンピュータ
130位
アクセスランキングを見る>>

[サブジャンルランキング]
ソフトウェア
12位
アクセスランキングを見る>>
FC2カウンター
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。