読み上げる文字列のフォーマットタイプ(テキストまたは、SSML)を指定する。このモード指定が適切でない場合は、再生時にエラーが表示される。
1.テキスト
通常は、このモードを指定する。
2.SSML
SSMLフォーマットの再生を行いたい場合に指定する。SSMLフォーマットで記述することで読み上げを行うテキストの音声合成エンジンの指定、音量、速度、ピッチ、読み仮名変換、息継ぎ時間(break time)などを自由にカスタマイズして再生することができる。
Haruziraは、SSML 1.0 に対応している。SSMLの仕様及び記述方法に関しては、下記サイトを参考にする。
最新のSSMLバージョンは1.1であるが、基本的なコマンドや記述方法は変わらない。
なお、SSML 1.0の全仕様に対応しているわけではないので注意する。(これはマイクロソフト社の仕様である)
Speech Synthesis Markup Language (SSML) Version 1.0
SSMLの記述例
<?xml version=”1.0″?>
<speak version=”1.0″ xmlns=”http://www.w3.org/2001/10/synthesis”
xmlns:xsi=”http://www.w3.org/2001/XMLSchema-instance”
xsi:schemaLocation=”http://www.w3.org/2001/10/synthesis http://www.w3.org/TR/speech-synthesis11/synthesis.xsd”
xml:lang=”ja-JP”>
<p>
<s>
こんにちは、Haruziraです。このテキストは<break time=’100ms’ />SSMLフォーマットに準拠して記述されていますが<break time=’100ms’ />詳しい仕様等に関してはW3Cのサイトを参照して下さい。
</s>
<voice gender=”female” xml:lang=”en-US”>
<prosody pitch=”+0%” rate=”0.8″>
<s>
Hello! I am Haruzira.<break time=’1000ms’ />These text are described by SSML format. Please reference to W3C Website for the specifications. Thank you!
</s>
</prosody>
</voice>
</p>
</speak>
※このサンプルをコピーし、Haruziraのテキスト領域にペースト(貼り付け)することで再生できる。