8 日本語テキスト音声合成用記号(JEIDA-62-2000)要素

8.1 <BOOKMARK> : 音声合成においてブックマークを挿入する

BOOKMARK要素は,音声合成においてブックマークを挿入する.

音声合成システムがこのタグを処理した時に,アプリケーションに識別子を出力する.

MARK属性
  • 実装:未対応
  • 用途:任意の識別子
  • 省略時:
  • 備考:

8.2 <CONTEXT> : 音声合成において内容に関する情報を記述する

CONTEXT要素は,音声合成において内容に関する情報を記述する.

読み上げ型をTYPE属性で指定する。対象は数字、英字、および一部の記号である。それ以外の文字は通常の読み方がされる。

リスト 8.1 CONTEXT要素の使用例
今日は<CONTEXT TYPE="DATE">2003-8-3</CONTEXT>です。
「今日は二千三年八月三日です」

今日は<CONTEXT TYPE="DATE" FORMAT="MDY" DELIM="/">8/3/2003</CONTEXT>です。
「今日は二千三年八月三日です」

時刻は<CONTEXT TYPE="TIME">12:34</CONTEXT>です。
「時刻は十二時三十四分です」

時刻は<CONTEXT TYPE="TIME">12:34:56</CONTEXT>です。
「時刻は十二時三十四分五十六秒です」

これは<CONTEXT TYPE="DIGITS">1234</CONTEXT>です。
「これは一二三四です」

人数は<CONTEXT TYPE="NUMBER">1234</CONTEXT>です。
「人数は千二百三十四です」

<CONTEXT TYPE="NUMBER">1,234.5</CONTEXT>
「千二百三十四点五」

<CONTEXT TYPE="NUMBER" FORMAT="ISO">1 234,5</CONTEXT>
「千二百三十四点五」

電話番号は<CONTEXT TYPE="PHONE">0120-123-4567</CONTEXT>です。
「電話番号は〇一二〇、一二三、四五六七です」
TYPE属性
  • 実装:対応済
  • 用途:内容の識別子。値として,NUMBER, DIGITS, DATE, TIME, PHONEのいずれかを指定する.これ以外の値をTYPE属性に指定した場合にはタグは無視される.TYPE属性の指定がない場合にはタグは無視される。タグが無視されるとき,タグの中身は読み上げられない.
  • 省略時:CONTEXTタグを用いない場合、数字はNUMBER (位取りして読み上げ)、英字は辞書にあればその読みで、なければアルファベットとして読み上げられる。
  • 備考:JEIDA仕様ではDEFAULT, PERSON, ADDRESS, CHAT, PHONE, DATE, TIME, URL, EMAIL, LISTが用意されている.NUMBER, DIGITSは独自拡張である.
FORMAT属性
  • 実装:対応済
  • 用途:DATE型においては,年月日の並び順を,FORMAT="MDY"のように指定する。NUMBER型においては,桁区切り文字と小数点記号の用法を指定する。FORMAT="ISO"を指定することにより、桁区切り文字がスペース、小数点記号がカンマとなる。
  • 省略時:DATE型においては,"YMD"(年,月,日の順).NUMBER型においては,桁区切り文字がカンマ,小数点記号がピリオドとなる.
  • 備考:
DELIM属性
  • 実装:対応済
  • 用途:DATE型において区切り文字を指定する。
  • 省略時:"-"(半角マイナス)
  • 備考:

8.3 <EMPH> : 合成音声において指定範囲の強調を指定する

EMPH要素は,合成音声において指定範囲の強調を指定する.

テキストの形態素境界だけでなく,どこにでも挿入可能である.

リスト 8.2 EMPH要素の使用例
私が欲しいのは、<EMPH>お金</EMPH>ではなく、<EMPH>時間</EMPH>です。

8.4 <LANG> : 合成音声において言語の指定を行なう

LANG要素は,合成音声において言語の指定を行なう.

ISO639属性
  • 実装:未対応
  • 用途:ISO639で指定された言語識別子
  • 省略時:
  • 備考:日本語の場合はja,英語の場合はen

8.5 <PARTOFSP> : 合成音声において品詞の指定を行なう

PARTOFSP要素は,合成音声において品詞の指定を行なう.

PART属性
  • 実装:未対応
  • 用途:品詞名を指定
  • 省略時:
  • 備考:JEIDA-62-2000表4-3参照.

8.6 <PITCH> : 合成音声においてピッチを指定する

PITCH要素は,合成音声においてピッチを指定する.

リスト 8.3 PITCH要素の使用例
   <PITCH LEVEL="0.8">私は、東京へ行きます。</PITCH>
   <PITCH LEVEL="1">私は、東京へ行きます。</PITCH>
   <PITCH LEVEL="2">私は、東京へ行きます。</PITCH>
   <PITCH RANGE="0.8">私は、東京へ行きます。</PITCH>
   <PITCH RANGE="1">私は、東京へ行きます。</PITCH>
   <PITCH RANGE="2">私は、東京へ行きます。</PITCH>
LEVEL属性
  • 実装:対応済
  • 用途:相対的なピッチによる指定
  • 省略時:標準値は1
  • 備考:LEVEL属性では、F0の値がもとの値に引数の数値を乗じた値に変更される.※JEIDA仕様では,-10から+10の相対的なピッチによる指定(標準値は0)
RANGE属性
  • 実装:対応済
  • 用途:通常の発声に対するピッチの振れ幅の相対的な指定
  • 省略時:標準値は1
  • 備考:RANGE属性では、F0の平均値を維持したまま、振れ幅を対数上で引数の数値を乗じた値に変更される。JEIDA-62-2000からの拡張.
ABSLEVEL属性
  • 実装:未対応
  • 用途:-10から+10の絶対的なピッチによる指定
  • 省略時:
  • 備考:

8.7 <PRON> : 合成音声において発音を指定する

PRON要素は,合成音声において発音を指定する.

リスト 8.4 PRON要素の使用例
最寄り駅は、<PRON SYM="ミナミク’サツ">南草津</PRON>です。
SYM属性
  • 実装:対応済
  • 用途:単語の読みやアクセント型の指定
  • 省略時:
  • 備考:JEIDA-62-2000における表2-1(読み記号),表2-2(韻律記号)が使用できる.
SAMPA属性
  • 実装:未対応
  • 用途:発音をSAMPAで指定
  • 省略時:
  • 備考:

8.8 <RATE> : 合成音声の速さの基準となる話速を指定する

RATE要素は,合成音声の速さの基準となる話速を指定する.

リスト 8.5 RATE要素の使用例
   <RATE SPEED="0.8">私は、東京へ行きます。</RATE>
   <RATE SPEED="1">私は、東京へ行きます。</RATE>
   <RATE SPEED="2">私は、東京へ行きます。</RATE>
SPEED属性
  • 実装:対応済
  • 用途:相対的なレベルによる話速の指定
  • 省略時:標準値は1
  • 備考:SPEED属性では、各音素の時間長の伸縮しやすさを考慮しながら、指定区間の時間長を引数の数値を乗じた値に変更する.※JEIDA仕様では-10から+10の相対的なレベルによる話速の指定(基準値0)
ABSSPEED属性
  • 実装:未対応
  • 用途:-10から+10の絶対的なレベルによる話速の指定
  • 省略時:
  • 備考:
MORASEC属性
  • 実装:未対応
  • 用途:モーラの平均値による話速の指定
  • 省略時:
  • 備考:値は0.1以上の正数でモーラ/秒.小数点以下は第一位まで指定可能.

8.9 <REGWORD> : 合成音声において単語登録を行なう

REGWORD要素は,合成音声において単語登録を行なう.

STRING属性
  • 実装:未対応
  • 用途:表記の指定
  • 省略時:
  • 備考:
READING属性
  • 実装:未対応
  • 用途:読みの指定
  • 省略時:
  • 備考:
PARTOFSP属性
  • 実装:未対応
  • 用途:品詞の指定
  • 省略時:
  • 備考:
SYMSAMPA属性
  • 実装:未対応
  • 用途:SAMPAによる読みの指定
  • 省略時:
  • 備考:

8.10 <RESET> : 合成音声においてSPEECH要素内の設定をすべて既存値に設定する

RESET要素は,合成音声においてSPEECH要素内の設定をすべて既存値に設定する.

8.11 <SPELL> : 合成音声において数字や英字の部分の綴り読みを指定する

SPELL要素は,合成音声において数字や英字の部分の綴り読みを指定する.

リスト 8.6 SPELL要素の使用例
SMARTのつづりは<SPELL>SMART</SPELL>です。
「スマートのつづりはエスエムエーアールティーです」

これは<SPELL>1234</SPELL>です。
「これはイチニーサンヨンです」

8.12 <SILENCE> : 合成音声に無音(ポーズ)を挿入する

SILENCE要素は,合成音声に無音(ポーズ)を挿入する.

W3C SSMLにおけるbreakと同じ機能を持ちます。

リスト 8.7 SILENCE要素の使用例
   お客様、<SILENCE MSEC="800"/>いらっしゃいませ。
   お客様、<SILENCE/>いらっしゃいませ。
MSEC属性
  • 実装:対応済
  • 用途:ポーズの長さをミリ秒単位で指定する
  • 省略時:
  • 備考:値には0-65535が使用可能です.
MORA属性
  • 実装:未対応
  • 用途:ポーズの長さをモーラ数単位で指定する
  • 省略時:
  • 備考:値には1.5などの小数(小数点以下は第一位まで)も指定可能です.

8.13 <SPEECH> : 合成音声においてRESETによって制御できる範囲を指定する

SPEECH要素は,合成音声においてRESETによって制御できる範囲を指定する.

8.14 <VOICE> : 合成音声において音声フォントおよび音質を指定する

VOICE要素は,合成音声において音声フォントおよび音質を指定する.

リスト 8.8 VOICE要素の使用例
   花子さんは、<VOICE OPTIONAL="female01">はい</VOICE>、と言った。
   太郎君は、<VOICE OPTIONAL="male02">はい</VOICE>、と言った。
   <VOICE ALPHA="0.5">私は、東京へ行きます。</VOICE>
   <VOICE ALPHA="0.42">私は、東京へ行きます。</VOICE>
   <VOICE ALPHA="0.3">私は、東京へ行きます。</VOICE>
OPTIONAL属性
  • 実装:対応済
  • 用途:必要条件を最も満たした音声フォントが使用される
  • 省略時:
  • 備考:
ALPHA属性
  • 実装:対応済
  • 用途:メルケプストラムの周波数ワーピング係数を変更する
  • 省略時:0.42
  • 備考:変更すると音質が変わる.
REQUIRED属性
  • 実装:未対応
  • 用途:条件を満たす音声フォントが見つからなかった場合は処理を破棄する
  • 省略時:
  • 備考:

8.15 <VOLUME> : 合成音声の音量を指定する

VOLUME要素は,合成音声の音量を指定する.

リスト 8.9 VOLUME要素の使用例
   <VOLUME LEVEL="0.8">私は、東京へ行きます。</VOLUME>
   <VOLUME LEVEL="1">私は、東京へ行きます。</VOLUME>
   <VOLUME LEVEL="2">私は、東京へ行きます。</VOLUME>
LEVEL属性
  • 実装:対応済
  • 用途:相対的なレベル指定
  • 省略時:標準値は1
  • 備考:LEVEL属性では、音量がもとの値に引数の数値を乗じた値に変更される.※JEIDA仕様では,0から100の相対的なレベル指定(標準値は100)