スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

【同じタグを付けた記事の一覧】

カナ読み上げツール KanateaTalk

2012年02月17日(金)20時24分

Galatea TalkAquesTalk のように

以前に書いた「Galatea Talk の音声合成部を C++ で使うサンプル」の内容に少し内容を足して、KanateaTalk というコマンドライン(いわゆる DOS 画面)用のツールを作ってみました。
文字通り「サンプル・コードに毛が生えた」程度の代物で、漢字かな交じり文を読んだりはできませんが、Galatea Talk の音声は商用利用を含む二次使用も認められていますので、ちょっとした警告メッセージや音声ガイド的なものを作ったりするくらいには使えるかな、と思います。

できること

AquesTalk のように、カナとアクセントの位置および区切りで構成された文字列を読み上げます。
つまり"キョ'ーノ/テ'ンキワ、「ハレ」デ'ス。"のような文字列を指定すると「KanateaTalk.mp3」のような音声を生成します。
生成した音声データは、通常はその場で読み上げられますが、指定すれば WAVE ファイル(16kHz/16Bit/Mono)として保存することも可能です。
音声記号文は、コマンドラインで直接指定することもできますが、TEXT ファイル(Shift-JIS/UTF-16/UTF-8)に記述して読み込ませることもできます。
また、文中にタグを埋め込むことで、読み上げ中に話者・速度・音量・音程を変更できます。

使い方

http://www.vector.co.jp/soft/winnt/art/se495518.html」からダウンロードしてください。
コマンドラインや BAT ファイルで「KanateaTalk.exe "コンニチワ。"」と指定すると、「こんにちは」と話します。
入力する音声記号文は、「'」でアクセント位置を指定し、文節区切りとして「/、。?」と括弧類が使用できます。
KanateaTalk.exe "コンニチワ。" "Hello.wav"」のように、WAVE ファイル名を併せて指定することで、指定したファイル名の WAVE ファイルが出力されます。
「コンニチワ。」と書いた TEXT ファイルを、「KanateaTalk.exe」にドラッグ&ドロップ等で指定することでも使えます。

コマンドライン・オプション

コマンドライン・オプションとして存在するのは「--o」の一つだけです。
これを指定しておくと、TEXT ファイル入力の際に、WAVE ファイル名を指定せずとも、TEXT ファイル名と同一名の WAVE ファイルとして出力されるようになります。

タグ

文中で指定可能なタグは、Galatea Talk に合わせてあります。
ただ、一見 XML 風になってはいますが、内部では単純な文字列比較で判定していますので、XML のような自由度はありません。
また、コマンドラインで指定する際に便利なよう、値を「"」で括らなくとも読むようにしてあります。

  • <SILENCE/>で適当な長さの無音区間を挿入
  • <SILENCE MSEC="1000"/>で1秒間の無音区間を挿入
  • <EMPH></EMPH>で囲まれた範囲は強調
  • <VOICE OPTIONAL="female01"></VOICE>等で囲まれた範囲は話者変更
  • <RATE SPEED="2.0"></RATE>等で囲まれた範囲は速度変更
  • <VOLUME LEVEL="2.0"></VOLUME>等で囲まれた範囲は音量変更
  • <PITCH LEVEL="2.0"></PITCH>等で囲まれた範囲は音程変更

余談1

以下は KanateaTalk を使用するうえではほとんど関係のない話なのですが、製作・公開にあたって少し悩んだ、ライセンス関連について。
この KanateaTalk は、前述の通り、Galatea Talk の一部を抜粋・流用して製作したものです。
そしてその Galatea Talk は、Galatea Toolkit という「擬人化音声対話エージェント」の一部、となっています。
つまり KanateaTalk は、間接的に Galatea Toolkit に依存しているということになり、であるならばその使用条件は、「Galatea Toolkit 使用許諾書」への同意、ということになります(以下、便宜上「Galatea Toolkit ライセンス」とします)。
ところが、同意してダウンロードした Galatea Toolkit アーカイブ内の「\engine\SSM\」フォルダには、「Copying.txt」というファイルが存在し、ここには Galatea Talk のライセンスが、本体である Galatea Toolkit とは別に規定されているのです。
それによると、gtalk(波形生成モジュール、つまり KanateaTalk が使用している部分)と話者モデルは、「Galatea ライセンス」というライセンスである、とされています。
ちょっと字面的にややこしいのですが、この「Galatea ライセンス」というのは、前述「Galatea Toolkit ライセンス」とは別物です。
これらを合わせて考えますと、KanateaTalk は「Galatea Toolkit ライセンス」と「Galatea ライセンス」の二つが適用される、ということに(多分)なるのではないかと思われます。
ところが、Galatea TalkGalatea Toolkit の構成要素の一つではありますが、それとは別に「http://sourceforge.jp/projects/galateatalk/」にて、Galatea Talk 単独でも公開されています。
この単独のものについては、「Galatea Toolkit ライセンス」的な文言は見当たらず、「Galatea ライセンス」のみが同梱されています。
ということは、Galatea Talk 単独のものを入手し、そのコア部分を流用した、という立場をとるならば、KanateaTalk は「Galatea ライセンス」のみ適用される、ということにもなり得るわけです。
もっとも実際のところ、「Galatea Toolkit ライセンス」も「Galatea ライセンス」も、その内容は「自由に使ってかまいませんが保証はしません」「ライセンス・ファイルを添付してください」というようなもので、どちらにしても大差はなさそうなのですが、KanateaTalk はとりあえず「Galatea ライセンス」に依ってあります。
理由はものすごく単純なことで、「Galatea ライセンス」ですと、アーカイブに含めるファイルが「License」一つで済むからです(「Galatea Toolkit ライセンス」ですと「kyodaku_E.txt」「kyodaku_J.txt」の二つが必要)。
もし、「それは違う」とか「こうすべき」、あるいは「こうしなければならない」というようなことがありましたら、コメント欄かメールフォームででも教えていただけると幸いです。

余談2

さらに全くもってどうでもいいことなのですが、上記「ライセンスについて」を書いているときに、昔は Galatea Toolkit をダウンロードするためにユーザ登録が必要だった、ということを思い出しました。
今でも「http://hil.t.u-tokyo.ac.jp/~galatea/index-jp.html」の下部、「Galatea Toolkit 使用許諾書」画面に移るためのリンクは、「ユーザ登録とダウンロードに進む」となっています(現在はリンク先で「同意」するだけ)。
自分の「音声合成」に対する興味はわりに古く、Galatea Talk も当然、ずいぶん前から知ってはいました。
にもかかわらず、なぜ最近になるまで使おうともしなかったのか?と、「Galatea Talk の音声合成部を C++ で使うサンプル」を書いてる時に自分自身で疑問に思っていたのですが、思い起こせばこの「ユーザ登録」が理由でした。
何度かブログでも触れているのですが、自分は個人情報というものに対してはわりに神経質なタイプで、ユーザ登録というようなものはあまり好きではなく、できる限り必要最小限にとどめようとします。
そのため、過去に Galatea Talk への興味がわき起こるたび Galatea Project のサイトを訪れ、「ユーザ登録」の画面を見てはあきらめる、ということを繰り返し、その中で自身の内に「これ(Galatea Talk)は存在しないもの」という認識を固定化させていったのでした。
そういえば、「Galatea Talk の音声合成部を C++ で使うサンプル」を書き、また今回 KanateaTalk を作ったのも、元々は Galatea Talk の辞書「UniDic」が、利用者登録しなければ最新版をダウンロードできず、それをしたくないために最新辞書が使えず、それならいっそ辞書無しか他の辞書を使う方法を模索してみよう、と思ったのが発端だったりします。

関連記事

【同じタグを付けた記事の一覧】
自作ソフト 音声技術 GalateaProject 音声合成 GalateaTalk

スポンサーサイト

コメントの投稿

非公開コメント

最新記事
最新コメント
Amazonおまかせリンク
カテゴリ
タグクラウド
Amazonお買い得ウィジェット
カレンダー
05 | 2017/06 | 07
- - - - 1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 -
月別アーカイブ
プロフィール

電脳太助

Author:電脳太助
Website:電脳スピーチ web

RSSリンクの表示
メールフォーム

名前:
メール:
件名:
本文:

サイト内検索
Ads by Google
FC2アクセスランキング
Ads by Google
FC2拍手ランキング
ユーザータグ

音楽管理(66)
ポータブル(57)
ソフト紹介(44)
プログラミング(42)
音声技術(41)
自作ソフト(35)
サイト運営(32)
FC2(31)
ブログ(30)
iTunes(27)
Windows(25)
LISMO(24)
音声合成(23)
音声認識(22)
x-アプリ(22)
電子ブック(22)
eラーニング(20)
バックアップ(19)
語学学習(19)
foobar2000(18)
ソースコード(18)
WindowsLiveWriter(15)
画像管理(15)
C++(14)
アフィリエイト(10)
DnspTools(10)
fi-6130(9)
FLAC(9)
JavaScript(9)
ウォークマン(9)
英語音読学習計画(8)
Gracenote(8)
Prolog(8)
ベクター(8)
雑記(8)
CodeBlocks(7)
SyntaxHighlighter(7)
TraConv(7)
spcbght(7)
wxWidgets(7)
VirtualBox(6)
W63CA(6)
DCP-J552N(6)
WinRT(6)
WindowsLiveMesh(6)
iGoinLM(6)
英語発音矯正実験(6)
ExactAudioCopy(6)
MP3Gain(6)
LAME(5)
音楽技術(5)
Mery(5)
楽器演奏(5)
GalateaTalk(4)
nLite(4)
WindowsLiveSkyDrive(4)
ホームページ(4)
GalateaProject(4)
MIDI(4)
LLVM(4)
PC-98(3)
カウンター(3)
AACGain(3)
iTCDini(3)
OverCutChecker(3)
拍手(3)
PK-513L(3)
UniversalExtractor(3)
アクセスランキング(3)
ImageCompositeEditor(2)
アクセス解析(2)
OCR(2)
qtaacenc(2)
資格試験(1)
AquesTalk(1)
AquesCmdDl(1)

FC2アクセスランキング
最新トラックバック
アクセスランキング
[ジャンルランキング]
コンピュータ
106位
アクセスランキングを見る>>

[サブジャンルランキング]
ソフトウェア
11位
アクセスランキングを見る>>
FC2カウンター
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。