音声合成マークアップ言語(SSML)のリファレンス


音声合成マークアップ言語(SSML)のリファレンス

音声合成マークアップ言語(SSML)を応答に使用することで、Alexaの音声を生成する方法を制御できます。たとえば、一時停止やその他の音声効果を追加できます。

SSMLについて

スキルのサービスからユーザーのリクエストに対する応答を返すときは、Alexaサービスが音声に変換するためのテキストを提供します。Alexaは、句点の後に休止を入れることや、疑問符で終わるテキストを疑問文として話すことなど、通常の句読点処理を自動的に実行します。

ただし、場合によっては、応答のテキストからAlexaが生成する音声に追加の制御を加える必要があります。たとえば、音声内の休止を長くしたり、数字文字列を標準的な電話番号として復唱したりする場合があります。Alexa Skills Kitでは、音声合成マークアップ言語(SSML)のサポートによってこれらの制御が提供されます。

SSMLは、合成音声の生成用にテキストをマークアップする標準的な手段を提供するマークアップ言語です。Alexa Skills Kitでサポートされているのは、SSML仕様で定義されているタグのサブセットです。サポートされている具体的なタグについては、サポートされるSSMLタグに記載します。

応答の中でSSMLを使用する方法

SSMLを使用するには、サポートされるSSMLタグを使用して出力音声を作成します。サービスから応答を送り返すときは、応答がプレーンテキストではなくSSMLを使用していることを明示する必要があります。JSON応答を直接構築する場合は、マークアップしたテキストをoutputSpeechプロパティに指定し、typePlainTextではなくSSMLに設定します。マークアップしたテキストの設定には、textではなくssmlプロパティを使用します。

"outputSpeech": {
    "type": "SSML",
    "ssml": "<speak>この出力音声はSSMLを使用しています。</speak>"
}

SSMLは、通常の出力音声応答と、応答に含まれる再プロンプトの両方に使用できます。

Alexa Skills Kit SDK for Node.jsまたはAlexa Skills Kit SDK for Javaを使用する場合は、SDKによって処理されるため、提供するSSMLにspeakタグを含める必要はありません。それ以外の場合、提供するSSMLは、<speak>タグで囲む必要があります。例:

クリップボードにコピーされました。

<speak>
    数字を基数として<w role="amazon:VBD">読み上げます</w><say-as interpret-as="cardinal">12345</say-as>。
    単語をスペルアウトします:
    <say-as interpret-as="spell-out">hello</say-as></speak>

SSMLのJSON出力では、出力内の引用符をエスケープするか、一重引用符と二重引用符を適切に使い分けてください。以下では、一重引用符がアトリビュートとして使用され、応答全体が二重引用符で括られています。

{
    "outputSpeech": {
    "type": "SSML",
    "ssml": "<speak>
        数字を基数として<w role='amazon:VBD'>読み上げます</w>
        :
        <say-as interpret-as='cardinal'>12345</say-as>。
        単語をスペルアウトします:
        <say-as interpret-as='spell-out'>hello</say-as>。</speak>"
    }
}

サポートされるSSMLタグ

Alexa Skills Kitでは、次に挙げるSSMLタグがサポートされています(英字順に記載します)。

なお、提供されたテキストに含まれる、サポートされていないSSMLタグは、Alexaサービスによって取り除かれることにご注意ください。

複数のSSMLタグを同じ応答に適用する

サポートされているほとんどのタグを相互に組み合わせて、複数の効果を音声に適用できます。たとえば、この例ではsay-asタグとamazon:emotionタグの両方を使用します。次の例では、文字列全体を高揚した音声で話し、指定された番号を個々の数字として話すようにAlexaに指示します。

クリップボードにコピーされました。

<speak>
    <amazon:emotion name="excited" intensity="medium">
        発射まで5秒!
        <say-as interpret-as="digits">54321</say-as>.
        発射!
    </amazon:emotion>
</speak>

互換性のないタグ

すべてのタグを組み合わせることはできません。次のタグは、同じ音声には適用できません。

  • amazon:domain
    • <amazon:domain name="conversational"><voice>タグでMatthewかJoannaの音声と組み合わせることができます。conversationalスタイルはほかのAmazon Pollyの音声では機能せず、<voice>なしでは動作しません。
    • <amazon:domain name="news"><voice>タグでMatthew、Joanna、Lupeの音声と組み合わせることができます。newsスタイルはほかのAmazon Pollyの音声では機能しません。
    • <amazon:domain name="long-form"><amazon:domain name="music"><amazon:domain name="fun">はいずれも、<voice>と組み合わせることができません。
  • amazon:emotion
  • speechcons

    Speechcon(感嘆詞)はsay-asタグでinterpret-asinterjectionに設定したものです。例:<say-as interpret-as="interjection">わぁ</say-as>

    say-asタグはinterpret-asに他の値を使用する場合は組み合わせることができます。たとえば、amazon:emotionまたはemphasis<say-as interpret-as="ordinal">1</say-as>と組み合わせることができます。

  • voice
    • voiceamazon:domainタグと組み合わせることができます。ただし、前述の制限があります。
    • voiceをここに記載したほかのタグと組み合わせることはできません。
  • emphasis
  • pitchアトリビュートを持つprosodyタグ(例:<prosody pitch="x-low">…</pitch>

たとえば、以下の例は無効です。

無効なSSML:voiceamazon:emotionの併用

<speak>
    <amazon:emotion name="disappointed" intensity="medium">
        秘密を教えましょう。
        <voice name="Mizuki">私は本当の人間ではないのです</voice>。
        信じられますか?
    </amazon:emotion>
</speak>

無効なSSML:amazon:emotionvoiceの併用

<speak>
    秘密を教えましょう。
    <voice name="Mizuki">
        <amazon:emotion name="disappointed" intensity="medium">
            私は本当の人間ではないのです。
        </amazon:emotion>
    </voice>
    信じられますか?
</speak>

conversationalまたはnewsスタイルで使用される互換性のない音声

<speak>
    <voice name="Kendra">
        <amazon:domain name="conversational">I really didn't know how this morning was going to start.And if I had known, I think I might have just stayed in bed.</amazon:domain>
    </voice>
</speak>

無効: <voice>タグなしで使用されるconversationalスタイル

<speak>
    <amazon:domain name="conversational">I really didn't know how this morning was going to start.And if I had known, I think I might have just stayed in bed.</amazon:domain>
</speak>

互換性のないタグは、同じテキスト文字列に適用されない限り、同じspeak文字列内で使用できます。たとえば、以下の組み合わせは有効です。

クリップボードにコピーされました。

<speak>
    <amazon:emotion name="disappointed" intensity="medium">
        秘密を教えましょう。
    </amazon:emotion>
    <voice name="Mizuki">
        私は本当の人間ではないのです。
    </voice>
    <amazon:emotion name="disappointed" intensity="high">信じられますか?</amazon:emotion>
</speak>

この場合、最初の行は落胆した声で話され、2行目は“Mizuki”の声で話され、最後の行は落胆した声を再び使用します。

amazon:domain

音声に異なるスタイルを適用します。スタイルでは、読み上げ音声でイントネーション、抑揚、一時停止などのさまざまなバリエーションを使用して、音声をコンテンツに合わせます。例えば、newsスタイルでは、Alexaの音声がテレビやラジオのニュースのような話し方になり、主にニュース記事やその他のニュースベースのコンテンツを聞くユーザー向けに提供されています。

amazon:domainタグでは、次のパラメーターが必須です。

アトリビュート 使用できる値

name

スピーチに適用する話し方の名前。使用可能なスタイル:

  • conversational – より会話的で堅苦しさを感じさせない音声スタイルです。友人や家族に話しかける場合に近い話し方です。conversationalスタイルは、英語(US)、イタリア語(IT)、日本語(JP)のスキルで利用できます。このスタイルはAmazon Pollyの音声でも使用できます。Amazon Pollyでconversationalスタイルを使うには、<voice>タグでMatthewかJoannaの音声と組み合わせる必要があります。
  • long-form – ポッドキャスト、記事、ブログなど長い形式のコンテンツに適した音声スタイルです。long-formスタイルをvoiceタグと組み合わせることはできません。long-formスタイルは、英語(US)のスキルでのみ利用できます。
  • music – 音楽、ビデオ、その他のマルチメディアコンテンツについて話す音声のスタイルを設定します。musicスタイルをvoiceタグと組み合わせることはできません。musicスタイルは、英語(US)、英語(CA)、英語(UK)、ドイツ語(DE)のスキルで利用できます。
  • news – テレビやラジオのニュースで聞くような音声のスタイルを設定します。newsスタイルはvoiceタグ、およびMatthew、Joanna、Lupeの音声と組み合わせて使用できます。newsは、英語(US)、英語(AU)のスキルで利用できます。
  • fun – 挨拶やアニメーション、子供向けの物語などでより元気でフレンドリーに聞こえる音声のスタイルを設定します。funスタイルは日本語(JP)のスキルで利用できます。

news

クリップボードにコピーされました。

<speak>
    <amazon:domain name="news">
        Latest news: The conversational and news styles are now available for the Matthew or Joanna voices!
    </amazon:domain>
</speak>

music

クリップボードにコピーされました。

<speak>
    <amazon:domain name="music">
        Sweet Child O' Mine by Guns N' Roses became one of their most
        successful singles topping the billboard Hot 100 in 1988.Slash's
        guitar solo on this song was ranked the 37th greatest solo of all
        time.Here's Sweet Child O' Mine.
    </amazon:domain>
</speak>

long-form

クリップボードにコピーされました。

<speak>
    <amazon:domain name="long-form">
        Meet Echo Dot.Our most popular Echo is now even better.
        With a new speaker and design, Echo Dot is a voice-controlled smart speaker with Alexa,
        perfect for any room.Just ask for music, news, information, and more.
        You can also call almost anyone and control compatible smart home devices with your voice.
    </amazon:domain>
</speak>

fun

クリップボードにコピーされました。

<speak>
    <amazon:domain name="fun">
        布団が、ふっとんだ。
    </amazon:domain>
</speak>

newsとvoiceの組み合わせ

この例では、同じ応答で2つの音声を使っています。

クリップボードにコピーされました。

<speak>
    <voice name="Matthew">
        <amazon:domain name="news">
            Latest news: The conversational and news styles are now available for the Matthew or Joanna voices!
        </amazon:domain>
    </voice>
    <voice name="Joanna">
        <amazon:domain name="conversational">
            That was all for today.Thank you.
        </amazon:domain>
    </voice>
</speak>

conversationalとvoiceの組み合わせ

<amazon:domain name="conversational"><voice>タグでMatthewかJoannaの音声と組み合わせることができます。<voice>タグなしでconversationalを使用することはできません。

クリップボードにコピーされました。

<voice name="Matthew">
    <amazon:domain name="conversational">I really didn't know how this morning was going to start.And if I had known, I think I might have just stayed in bed.
    </amazon:domain>
</voice>

amazon:domain互換性のないタグ以外の、すべてのタグと組み合わせることができます。

amazon:domainタグのベストプラクティス

以下の推奨事項は、amazon:domainタグを使用したカスタマーエクスペリエンスの向上に役立ちます。

  • スキルの始めの応答ではamazon:domainタグなしでAlexaのデフォルトの音声を使用します。これにより、「基準」となる話し方が設定されるため、後の特徴的なスタイルのインパクトがより強くなります。
  • Alexaの話し方のスタイルは過度に使用しないでください。ユーザーエクスペリエンスが低下したり、不愉快なものになる可能性があります。たとえば、話し方のスタイルを頻繁に切り替えることは避けてください。
  • デバイスまたは開発者コンソールのシミュレーターで応答がどのように聞こえるかをテストし、Alexaの音声と話し方が応答にふさわしいことを確認してください。

amazon:effect

音声にAmazon固有の効果を適用します。

アトリビュート 使用できる値

name

音声に適用できる効果の名前。利用可能な効果は次のとおりです。

  • whispered: ささやき声の効果を音声に適用します。

クリップボードにコピーされました。

<speak>
    秘密を教えましょう。
    <amazon:effect name="whispered">私は本当の人間ではないのです。</amazon:effect>.
    信じられますか?
</speak>

amazon:emotion

amazon:emotionタグは、Alexaが話すときに感情を表します。これは、ストーリー、ゲーム、ニュース、その他の物語体のコンテンツに役立ちます。たとえば、ゲームでは、正解時に「高揚」の感情を使用し、誤答時には「落胆」の感情を使用できます。

amazon:emotionタグでは、次のパラメーターが必須です。

アトリビュート 使用できる値

name

スピーチに適用する話し方の名前。利用可能な感情:

  • excited
  • disappointed

intensity

表現する感情の起伏または強さ。指定できる値:

  • low
  • medium
  • high

クリップボードにコピーされました。

<speak>
    <amazon:emotion name="excited" intensity="medium">
        クリスティーナが優勝しました!
    </amazon:emotion>
</speak>

クリップボードにコピーされました。

<speak>
    <amazon:emotion name="disappointed" intensity="high">
        とても残念なことがありました。
        どうすればいいのでしょう。
    </amazon:emotion>
</speak>

amazon:emotionと他のSSMLタグと組み合わせた例

amazon:emotionを他のすべてのタグと組み合わせることができます(互換性のないタグを除く)。

この例では「高揚」した感情を持つスピーチの途中で3秒の一時停止を追加します。

クリップボードにコピーされました。

<speak>
    <amazon:emotion name="excited" intensity="medium">
        ゆっくり深呼吸をしましょう。
        <break time="3s"/>
        リフレッシュできましたか?
    </amazon:emotion>
</speak>

この例では、prosodyを使用して「落胆」した音声の音量を上げています。

クリップボードにコピーされました。

<speak>
    いまは普通に話しています。
    <amazon:emotion name="disappointed" intensity="high">
        いまはがっかりしています。
        <prosody volume="x-loud">いまは非常にがっかりしています!</prosody>
    </amazon:emotion>
</speak>

amazon:emotionタグのベストプラクティス

以下の推奨事項は、amazon:emotionタグを使用してカスタマーエクスペリエンスを向上させるのに役立ちます。

  • スキルの始めの応答ではamazon:emotionタグなしでAlexaのデフォルトの音声を使用します。これにより、基準となる話し方が設定されるため、後の特徴的なスタイルがより印象を与える可能性があります。
  • 感情的な応答を過度に使用しないでください。カスタマーエクスペリエンスが低下したり、不愉快なものになる可能性があります。次のガイドラインを考慮してください。
    • 高頻度で高揚と落胆を切り替えないでください。
    • すべての反応で感情を使用しないでください。
  • 最初にmediumの強度を試し、必要に応じて調整します。ほとんどの場合にmediumを使用すると、状況に応じて強度を上げたり下げたりする選択肢が多くなります。
  • デバイスまたは開発者コンソールのシミュレーターで応答がどのように聞こえるかをテストし、Alexaの音声が応答に適していることを確認します。

audio

audioタグには、MP3ファイルのURLを指定して、応答の音声化中にそのファイルをAlexaサービスに再生させることができます。これは、サービスの応答の中に、事前に録音した短い音声を埋め込むために使用できます。たとえば、読み上げ応答と一緒にサウンド効果を再生したり、自社ブランドに関連付けられた音声を使用して応答を提供したりできます。

アトリビュート 使用できる値

src

MP3ファイルのURLを指定します。次に挙げる要件と制限にご注意ください。

  • MP3は、インターネットからアクセス可能なHTTPSエンドポイントでホストされる必要があります。HTTPSであることが必須です。また、MP3ファイルをホストするドメインは、有効で、信頼できるSSL証明書を提示する必要があります。自己署名証明書は使用できません。
  • MP3には、ユーザーに固有な情報や、その他の機密情報が含まれていてはなりません。
  • MP3は、有効なMP3ファイル(MPEGバージョン2)である必要があります。
  • 音声応答の場合、音声ファイルは240秒以内でなければなりません。
  • 応答outputSpeechプロパティに含めることのできるすべての音声ファイルの合計再生時間は240秒までです。
  • 応答repromptプロパティに含めることのできるすべての音声ファイルの合計再生時間は90秒までです。
  • ビットレートは48kbpsでなければなりません。このビットレートは、話される内容と組み合わせて使用すると良好な結果が得られますが、音楽を再生するには一般に品質がやや不十分です。
  • サンプルレートは22050Hz、24000Hz、16000Hzのいずれかです。

必要に応じて、変換ソフトウェアを使用してMP3ファイルを必要なコーデックバージョン(MPEGバージョン2)とビットレート(48kbps)に変換してください。

audioタグは、speakタグで囲まれた読み上げ応答テキスト内に組み込みます。Alexaは、読み上げテキストの指定された時点でMP3ファイルを再生します。例:

クリップボードにコピーされました。

<speak>
    配車サービスへようこそ。
    <audio src="soundbank://soundlibrary/transportation/amzn_sfx_car_accelerate_01" />
    配車または料金の見積もりをリクエストできます。
    どちらにしますか?
</speak>

Alexaがこの応答を再生すると、以下のように聞こえます。

Alexa: 配車サービスへようこそ。
(指定した音声ファイルamzn_sfx_car_accelerate_01.mp3が再生されます)
Alexa: 配車または料金の見積もりをリクエストできます。どちらにしますか?

サービスから送信する1回の応答に複数のaudioタグを含めることができますが、次の制限に従う必要があります。

  • 1回の応答の中で使用できる音声ファイルは5個までです。
  • 応答outputSpeechプロパティに含めることのできるすべての音声ファイルの合計再生時間は240秒までです。
  • 応答repromptプロパティに含めることのできるすべての音声ファイルの合計再生時間は90秒までです。

音声ファイルをAlexaに適した形式に変換する

変換ソフトウェアを使用してMP3ファイルを必要なコーデックバージョン(MPEGバージョン2)とビットレート(48kbps)に変換できます。コマンドラインツールのFFmpegを使用できます。

次のコマンドにより、指定した<input-file>audioタグで再生できるMP3ファイルに変換できます。このバージョンでは、サンプリングレートを16000に設定しています。

ffmpeg -i <input-file> -ac 2 -codec:a libmp3lame -b:a 48k -ar 16000 -write_xing 0 <output-file>

品質を向上させるには、次のようにサンプリングレートを24000に増やします。

ffmpeg -i <input-file> -ac 2 -codec:a libmp3lame -b:a 48k -ar 24000 -write_xing 0 <output-file>

コマンドラインオプションの詳細については、FFmpegに関する文書を参照してください。

その他のオプションでは、Audacityがあります。

  1. 変換するファイルを開きます。
  2. 左下にあるProject Rate16000に設定します。
  3. FileExport Audioの順にクリックし、Save as typeMP3 Filesに変更します。
  4. Optionsをクリックし、Quality48 kbpsに設定し、Bit Rate ModeConstantに設定します。

これには、Lameライブラリが必要です。http://lame.buanzo.org/#lamewindlにあります。

スキルのために音声ファイルをホストする

音声を提供するために使用するMP3ファイルは、HTTPSを使用するエンドポイント上でホストされている必要があります。このエンドポイントでは、Amazon認定の認証局が署名したSSL証明書を提供する必要があります。これは、多くのコンテンツホスティングサービスで提供されています。たとえば、Amazon Simple Storage Service(Amazon S3)アマゾンウェブサービスが提供)などのサービスでファイルをホストできます。

音声ファイルのリクエストを認証する必要はありません。このため、音声ファイルにはユーザーに固有の情報や機密情報を含めてはなりません。たとえば、ユーザーのリクエストに応答してカスタムMP3ファイルを作成し、その音声の中に機密情報を組み込む、ということは許可されていません。

パフォーマンスを最適化するには、スキルをホスティングしている地域に近い場所でSSML応答のMP3ファイルをホスティングすることをおすすめします。たとえば、スキルのLambda関数がアジアパシフィック(東京)地域でホスティングされている場合、MP3をアジアパシフィック(東京)のS3バケットにアップロードするとパフォーマンスが向上します。

音声ファイルのHLS(HTTP Live Streaming)

Alexaでは、SSMLのaudioタグがサポートされています。音声データが要件を満たしている場合、このタグを使用してHLS(HTTP Live Streaming)ストリームを指定できます。Alexaで使用されているストリーミング手法では、静的に配信されるMP3ファイルの代わりにHLSストリームを使用するメリットはありません。また、静的に配信されるMP3ファイルと異なり、240秒の時間制限を超過したHLSストリームが含まれているSSML応答は、警告なしで失敗します。警告なしの失敗とは、「時間制限に達する前に再生が停止し、ユーザーのデバイスにエラーメッセージが表示されず、スキルがエラーリクエストを受信しない」という意味です。HLSストリームが含まれているSSML応答をスキルで使用する場合、その応答の中で返される音声データを入念にテストしてください。

break

音声の中での休止を表します。休止の長さは、strengthまたはtimeアトリビュートで設定します。

アトリビュート 使用できる値

strength

  • none 休止は出力されません。これは、通常なら出力される休止(句点の後の休止など)を削除するために使用できます。
  • x-weak 休止は出力されません(noneと同じ)。
  • weak 隣り合った単語が、読点が1つ入っている場合のように処理されます(mediumと同じ)。
  • medium 隣り合った単語が、読点が1つ入っている場合のように処理されます。
  • strong センテンスの休止を入れます(sタグを使用した場合と同じ)。
  • x-strong 段落の休止を入れます(pタグを使用した場合と同じ)。

time

休止する期間。最大10秒(10s)、つまり10000ミリ秒(10000ms)までです。時間の単位(sまたはms)を含めてください。

デフォルトはmediumです。これはアトリビュートを指定しなかった場合、またはサポートされていないアトリビュート値を指定した場合に使用されます。

クリップボードにコピーされました。

<speak>
    ここで3秒間一時停止します <break time="3s"/>
    その後続きを読み上げます。
</speak>

emphasis

タグで囲まれた単語またはフレーズを強調します。強調では、音声の速さと音量を変えます。強調の度合いが高くなると、より大きな声で、ゆっくり話されます。強調の度合いが低くなると、より小さな声で、かつ早口で話されます。

アトリビュート 使用できる値

level

  • strong 音量を上げ、話す速度を遅くすることにより、音声は、より大きな声、かつゆっくりになります。
  • moderate 音量を上げ、話す速度を遅くしますが、strongを設定した場合より控えめになります。これは、levelを指定しなかった場合のデフォルトとして使用されます。
  • reduced 音量を下げ、話す速度を速くします。音声は、柔らかく、早口になります。

クリップボードにコピーされました。

<speak>
    言ったとおり私はあの人が
    <emphasis level="strong">大好き</emphasis>
    です。
</speak>

emphasisタグは互換性のないタグ以外の、すべてのタグと組み合わせることができます。

lang

langは、言語モデルとルールを指定してタグの付いたコンテンツをxml:langアトリビュートで指定した言語で書かれているかのように発話させるために使います。他の言語の単語やフレーズをlangタグで囲むと、多くの場合、発音がよくなります。レストランやショップの名前など、他の言語の短いフレーズに使うと効果的です。

たとえば、以下は言語コードfr-FR(フランスで話されるフランス語)を使って「Paris」を発音する方法です。

クリップボードにコピーされました。

<speak>
    In Paris, they pronounce it <lang xml:lang="fr-FR">Paris</lang>
</speak>

Alexaはスキルの元の言語で利用できるサウンドを使用して発音します。このため、ネイティブスピーカーとまったく同じようには聞こえない可能性があります。langタグだけを使用した場合よりも自然な音声にするには、langタグとvoiceタグを一緒に使います。voiceタグを使うと、特定の言語に合わせてカスタマイズされた音声を選択できます。このように、タグを付けたテキストをlangアトリビュートに一致させ、voiceアトリビュートでテキストの言語も表すようにします。

たとえば、フランス語のフレーズ「J'adore chanter」を英語(US)のスキルで、voiceタグを使わないでlangタグで表すとします。Alexaは英語の発音でそのフレーズを発音します。

<lang>タグなし フランス語に設定した<lang>タグあり
<speak>J'adore chanter</speak>
<speak>
    <lang xml:lang="fr-FR">J'adore chanter</lang>
</speak>

この場合、Alexaが「フランス語らしい」発音になるように英語で利用できる音声を使ってフランス語を発音します。

完璧なフランス語の発音では、「adore」という単語に口蓋垂ふるえ音(/R/)が含まれます。 langタグを使って実現されるフランス語らしい英語の発音では、代わりに対応する/r/のサウンドを使用します。

xml:langアトリビュートがサポートされるロケール

以下のロケールがサポートされています。

  • de-DE
  • en-AU
  • en-CA
  • en-GB
  • en-IN
  • en-US
  • es-ES
  • es-MX
  • es-US
  • fr-CA
  • fr-FR
  • hi-IN
  • it-IT
  • ja-JP
  • pt-BR

p

段落を表します。このタグは、タグの前後にextra-strongの休止を入れます。これは、pauseに<break strength="x-strong"/>を指定した場合と同じです。

クリップボードにコピーされました。

<speak>                                         
    <p>これは第一段落です。このテキストの読み上げ後、一時停止が入ります。</p>       
    <p>これは第二段落です。</p>
</speak>                                        

phoneme

これで囲んだテキストに音素/音声的な発音を指定します。たとえば、「pecan」という単語は、人によって発音が違います。

アトリビュート 使用できる値

alphabet

次の音声記号を使用することを設定します:

  • ipa 国際音声記号(IPA)。
  • x-sampa X-SAMPA(The Extended Speech Assessment Methods Phonetic Alphabet)。

ph

話す内容の音声学的発音。

スキルでサポートされる言語のそれぞれでサポートされる記号の一覧については、以下を参照してください。

このタグを使用した場合、Alexaは、タグで囲まれたテキストではなく、phアトリビュートに指定された発音を使用します。そうではあっても、人間に読めるテキストをタグで囲んで提供する必要があります。次の例では、タグで囲まれた単語「pecan」は話されません。その代わりに、Alexaは、次のようにphアトリビュートに指定されたテキストを話します。

クリップボードにコピーされました。

<speak>
    あなたは <phoneme alphabet="ipa" ph="pɪˈkɑːn">pecan</phoneme> と言います。​
    私は <phoneme alphabet="ipa" ph="ˈpi.kæn">pecan</phoneme> と言います。
</speak>

音声記号で単語を記述する例を次に示します。

単語 IPA X-SAMPA
bottle ˈbɑ.təl "bA.t@l
frozen ˈfɹoʊ.zən "fr\oU.z@n
blossom ˈblɑ.səm "blA.s@m

サポートされる記号

次の表に、phonemeタグでの使用がサポートされている記号を記載します。これらの記号は、スキルの言語に固有のものです。

これらの記号は、アラビア語(SA)の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。アラビア語(SA)のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

X-SAMPA IPA 説明 発音

?

ʔ

声門破裂音

أَنَا

/ " ʔ a n a: /

b

b

有声両唇破裂音

بَلَد

/ " b a l a d /

t

t

無声歯茎破裂音

تَمَر

/ " t a m a r /

T

θ

無声歯摩擦音

ثَلَاثَة

/ T a " l a: T a /

dZ

ʤ

有声後部歯茎破擦音

جَمِيل

/ dZ a " m i: l /

X\

ħ

無声咽頭摩擦音

حَيَوَان

/ X\ a j a " w a: n /

x

x

無声軟口蓋摩擦音

خَرُوف

/ x a " r u: f /

d

d

有声歯茎破裂音

دَرْدَار

/ d a r " d a: r /

D

ð

有声歯摩擦音

ذَلِك

/ " D a: l i k a /

r

r

歯茎ふるえ音

رَمْل

/ " r a m l /

z

z

有声歯茎摩擦音

زُهُور

/ z u " h u: r /

s

s

無声歯茎摩擦音

سَمْسَم

/ " s a m s a m /

S

ʃ

無声後部歯茎摩擦音

شَمْس

/ " S a m s /

s_?\

有声無声歯茎摩擦音

صَاحِب

/ " s_?\ A_?: X\ i b /

d_?\

emphatic 有声歯茎破裂音

ضَوْء

/ " d_?\ a w ? /

t_?\

有声無声歯茎破裂音

طَالِب

/ " t_?\ A_?: l i b /

D_?\

ðˤ

emphatic 有声歯摩擦音

ظَلَام

/ " D_?\ A_?\ l a: m /

?\

ʕ

有声咽頭摩擦音

عُمْر

/ " ?\ u m r /

G

ɣ

有声軟口蓋摩擦音

غَرْب

/ " G a r b /

f

f

無声唇歯摩擦音

فَصْل

/ " f A_?\ s_?\ l /

q

q

無声口蓋垂破裂音

قَصْر

/ " q A_?\ s_?\ r /

k

k

無声軟口蓋破裂音

كَامِل

/ " k a: m i l /

l

l

有声歯茎側面接近音

لَيْل

/ " l a j l /

l_G

有声歯茎側面接近音

والله

/ w A_?\ " l_G l_G A_?: h /

m

m

両唇鼻音

مَصْر

/ " m A_?\ s_?\ r /

n

n

歯茎鼻音

نُور

/ " n u: r /

h

ɦ

無声声門摩擦音

هِلَال

/ h i " l a: l /

w

w

有声両唇軟口蓋接近音

وَلَد

/ " w a l a d /

j

j

硬口蓋接近音

يُسْر

/ " j u s r /

g

g

有声軟口蓋破裂音

إِنْجِلِتْرَا

/ ? i N " g l i t r a: /

v

v

有声唇歯摩擦音

فِيتَامِين

/ v i: t A " m i: n /

p

p

無声両唇破裂音

أُوبِرَا

/ " ? O p e r a: /

N

ŋ

軟口蓋鼻音

ْهُونْغْ كُونْغ

/ h O N " k O N g /

Z

ʒ

有声後部歯茎摩擦音

جاكيت

/ Z a " k e: t /

a

æ

非円唇前舌狭めの広母音

لَوْن

/ " l a w n /

A_?\

ɑˤ

非円唇後舌広有声母音

صَلْب

/ " s_?\ A_?\ l b /

a:

æː

非円唇前舌広長母音

بَاب

/ " b a: b /

A_?:

ɑˤː

非円唇後舌広有声母音

نَاضِج

/ " n A_?: d_?\ i_?\ dZ /

u

u

円唇後舌狭母音

شُرْب

/ " S u r b /

u_?\

円唇後舌狭有声母音

عُصْفُور

/ ?\ u_?\ s_?\ " f u: r /

u:

円唇後舌狭長母音

تُوت

/ " t u: t /

u_?:

uˤː

円唇後舌狭有声母音

صُور

/ " s_?\ u_?: r /

i

i

非円唇前舌狭母音

بِنْت

/ " b i n t /

i_?\

非円唇前舌狭有声母音

طِفْل

/ " t_?\ i_?\ f l /

i:

非円唇前舌狭長母音

سَبِيل

/ s a " b i: l /

i_?:

iˤː

非円唇前舌狭有声長母音

رَطِيب

/ r A_?\ " t_?\ i_?: b /

A

a

非円唇後舌広母音

wifi

/ " w A j f A j /

O

ɔ

円唇後舌半広母音

دُولَار

/ d O " l A r /

O:

ɔː

円唇後舌半広長母音

تِلْفِزِيُون

/ t i l f i z " j O: n /

e

e

非円唇前舌半狭母音

إِنْتَرْنِت

/ ? e n t a r " n a: t /

e:

非円唇前舌半狭長母音

سِكْرِتِير

/ s i k r i " t e: r /

これらの記号は、英語(AU)の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。英語(AU)のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

子音
IPA X-SAMPA 説明
b b 有声両唇破裂音 bed
d d 有声歯茎破裂音 dig
d͡ʒ dZ 有声後部歯茎破擦音 jump
ð D 有声歯摩擦音 then
f f 無声唇歯摩擦音 five
g g 有声軟口蓋破裂音 game
h h 無声声門摩擦音 house
j j 硬口蓋接近音 yes
k k 無声軟口蓋破裂音 cat
l l 歯茎側面接近音 lay
m m 両唇鼻音 mouse
n n 歯茎鼻音 nap
ŋ N 軟口蓋鼻音 thing
p p 無声両唇破裂音 speak
ɹ r\ 歯茎接近音 red
s s 無声歯茎摩擦音 seem
ʃ S 無声後部歯茎摩擦音 ship
t t 無声歯茎破裂音 trap
t͡ʃ tS 無声後部歯茎破擦音 chart
θ T 無声歯摩擦音 thin
v v 有声唇歯摩擦音 vest
w w 両唇軟口蓋接近音 west
z z 有声歯茎摩擦音 zero
ʒ Z 有声後部歯茎摩擦音 vision
母音
IPA X-SAMPA 説明
ə @ 中舌中央母音 arena
æ { 非円唇前舌狭めの広母音 trap
aI 二重母音 price
aU 二重母音 mouth
ɑ A 非円唇後舌広長母音 father
eI 二重母音 face
ɜ 3 非円唇中舌半広母音 nurse
ɛ E 非円唇前舌半広母音 dress
i i 非円唇前舌狭長母音 fleece
ɪ I 非円唇前舌め広めの狭母音 kit
əʊ @U 二重母音 goat
ɔ O 円唇後舌半広長母音 thought
ɔɪ OI 二重母音 choice
u u 円唇後舌狭長母音 goose
ʊ U 円唇後舌め広めの狭母音 foot
ʌ V 非円唇後舌半広母音 strut
ɒ Q 円唇後舌広母音 bother
ɛə E@ 二重母音 bear
ɪə I@ 二重母音 beer
ʊə U@ 二重母音 tour
追加の記号
IPA X-SAMPA 説明
ˈ " 第一アクセント Alabama
ˌ % 第二アクセント Alabama
. . 音節の境界 A.la.ba.ma

これらの記号は、英語(CA)の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。英語(CA)のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

子音
IPA X-SAMPA 説明
b b 有声両唇破裂音 bed
d d 有声歯茎破裂音 dig
d͡ʒ dZ 有声後部歯茎破擦音 jump
ð D 有声歯摩擦音 then
f f 無声唇歯摩擦音 five
g g 有声軟口蓋破裂音 game
h h 無声声門摩擦音 house
j j 硬口蓋接近音 yes
k k 無声軟口蓋破裂音 cat
l l 歯茎側面接近音 lay
m m 両唇鼻音 mouse
n n 歯茎鼻音 nap
ŋ N 軟口蓋鼻音 thing
p p 無声両唇破裂音 speak
ɹ r\ 歯茎接近音 red
s s 無声歯茎摩擦音 seem
ʃ S 無声後部歯茎摩擦音 ship
t t 無声歯茎破裂音 trap
t͡ʃ tS 無声後部歯茎破擦音 chart
θ T 無声歯摩擦音 thin
v v 有声唇歯摩擦音 vest
w w 両唇軟口蓋接近音 west
z z 有声歯茎摩擦音 zero
ʒ Z 有声後部歯茎摩擦音 vision
母音
IPA X-SAMPA 説明
ə @ 中舌中央母音 arena
ɚ @` R音性中舌中央母音 reader
æ { 非円唇前舌狭めの広母音 trap
aI 二重母音 price
aU 二重母音 mouth
ɑ A 非円唇後舌広長母音 father
eI 二重母音 face
ɝ 3` R音性非円唇中舌半広母音 nurse
ɛ E 非円唇前舌半広母音 dress
i i 非円唇前舌狭長母音 fleece
ɪ I 非円唇前舌め広めの狭母音 kit
oU 二重母音 goat
ɔ O 円唇後舌半広長母音 thought
ɔɪ OI 二重母音 choice
u u 円唇後舌狭長母音 goose
ʊ U 円唇後舌め広めの狭母音 foot
ʌ V 非円唇後舌半広母音 strut
追加の記号
IPA X-SAMPA 説明
ˈ " 第一アクセント Alabama
ˌ % 第二アクセント Alabama
. . 音節の境界 A.la.ba.ma

これらの記号は、英語(IN)の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。英語(IN)のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

子音
IPA X-SAMPA 説明
b b 有声両唇破裂音 bed
d d 有声歯茎破裂音 dig
d͡ʒ dZ 有声後部歯茎破擦音 jump
ð D 有声歯摩擦音 then
f f 無声唇歯摩擦音 five
g g 有声軟口蓋破裂音 game
h h 無声声門摩擦音 house
j j 硬口蓋接近音 yes
k k 無声軟口蓋破裂音 cat
l l 歯茎側面接近音 lay
m m 両唇鼻音 mouse
n n 歯茎鼻音 nap
ŋ N 軟口蓋鼻音 thing
p p 無声両唇破裂音 speak
ɹ r\ 歯茎接近音 red
s s 無声歯茎摩擦音 seem
ʃ S 無声後部歯茎摩擦音 ship
t t 無声歯茎破裂音 trap
t͡ʃ tS 無声後部歯茎破擦音 chart
θ T 無声歯摩擦音 thin
v v 有声唇歯摩擦音 vest
w w 両唇軟口蓋接近音 west
z z 有声歯茎摩擦音 zero
ʒ Z 有声後部歯茎摩擦音 vision
母音
IPA X-SAMPA 説明
ə @ 中舌中央母音 arena
æ { 非円唇前舌狭めの広母音 trap
aI 二重母音 price
aU 二重母音 mouth
ɑ A 非円唇後舌広長母音 father
eI 二重母音 face
ɜ 3 非円唇中舌半広母音 nurse
ɛ E 非円唇前舌半広母音 dress
i i 非円唇前舌狭長母音 fleece
ɪ I 非円唇前舌め広めの狭母音 kit
əʊ @U 二重母音 goat
ɔ O 円唇後舌半広長母音 thought
ɔɪ OI 二重母音 choice
u u 円唇後舌狭長母音 goose
ʊ U 円唇後舌め広めの狭母音 foot
ʌ V 非円唇後舌半広母音 strut
ɒ Q 円唇後舌広母音 bother
ɛə E@ 二重母音 bear
ɪə I@ 二重母音 beer
ʊə U@ 二重母音 tour
追加の記号
IPA X-SAMPA 説明
ˈ " 第一アクセント Alabama
ˌ % 第二アクセント Alabama
. . 音節の境界 A.la.ba.ma
ヒンディー語の子音
IPA XSAMPA 説明
p_h 無声有気両唇破裂音 फूल (phool)
b_h 有声有気両唇破裂音 भारी (bhaari)
t_d 無声歯破裂音 तापमान (taapmaan)
t̪ʰ t_d_h 無声有気歯破裂音 थोड़ा (thoda)
d_d 有声歯破裂音 दिल्ली (dilli)
d̪ʱ d_d_h 有声有気歯破裂音 धोबी (dhobi)
ʈ t` 無声そり舌破裂音 टोरा (katora)
ʈʰ t`_h 無声有気そり舌破裂音 ठंड (thand)
ɖ d` 有声そり舌破裂音 र (darr)
ɖʱ d`_h 有声有気そり舌破裂音 ढाल (dhal)
tʃʰ tS_h 無声有気硬口蓋破擦音 छाल (chaal)
dʒʱ dZ_h 有声有気硬口蓋破擦音 झाल (jhaal)
k_h 無声有気軟口蓋破裂音 खान (khan)
ɡʱ g_h 有声有気軟口蓋破裂音 घान (ghaan)
ɳ n` そり舌鼻音 क्ष (kshan)
ɾ 4 歯茎はじき音 राम (ram)
ɽ r` 舌端そり舌はじき音 ड़ा (bada)
ɽʱ r`_h 有声有気そり舌はじき音 ढ़ी (barhi)
ʋ v\ 両唇接近音 सूल (wasool)
ヒンディー語の母音
IPA XSAMPA 説明
ə @_o 中舌中央母音 च्छा (achhaa)
ə̃ @~ 中段中舌鼻母音 हँसना (hansnaa)
a A_o 非円唇前舌広母音 ग (aag)
A~ 非円唇前舌広鼻母音 घड़ियाँ (ghariyaan)
ɪ I_o 非円唇前舌め広めの狭母音 क्कीस (ikkees)
ɪ̃ I~ 非円唇前舌め広めの狭鼻母音 सिंचाई (sinchai)
i i_o 非円唇前舌狭母音 बिल्ली (billee)
i~ 非円唇前舌狭鼻母音 हीं (nahin)
ʊ U_o 円唇後舌め広めの狭母音 ल्लू (ullu)
ʊ̃ U~ 円唇後舌め広めの狭鼻母音 मुँह (munh)
u u_o 円唇後舌狭母音 फूल (phool)
u~ 円唇後舌狭鼻母音 ऊँट (oont)
ɔ O_o 円唇後舌半広母音 कौन (kaun)
ɔ̃ O~ 円唇後舌半広鼻母音 भौं  (bhaun)
o o 円唇後舌半狭母音 सोना (sona)
o~ 円唇後舌半狭鼻母音 क्यों (kyon)
ɛ E_o 非円唇前舌半広母音 पैसा (paisa)
ɛ̃ E~ 非円唇前舌半広鼻母音 मैं (main)
e e 非円唇前舌半狭母音 क (ek)
e~ 非円唇前舌半狭鼻母音 किताबें  (kitabein)

これらの記号は、英語(UK)の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。英語(UK)のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

子音
IPA X-SAMPA 説明
b b 有声両唇破裂音 bed
d d 有声歯茎破裂音 dig
d͡ʒ dZ 有声後部歯茎破擦音 jump
ð D 有声歯摩擦音 then
f f 無声唇歯摩擦音 five
g g 有声軟口蓋破裂音 game
h h 無声声門摩擦音 house
j j 硬口蓋接近音 yes
k k 無声軟口蓋破裂音 cat
l l 歯茎側面接近音 lay
m m 両唇鼻音 mouse
n n 歯茎鼻音 nap
ŋ N 軟口蓋鼻音 thing
p p 無声両唇破裂音 speak
ɹ r\ 歯茎接近音 red
s s 無声歯茎摩擦音 seem
ʃ S 無声後部歯茎摩擦音 ship
t t 無声歯茎破裂音 trap
t͡ʃ tS 無声後部歯茎破擦音 chart
θ T 無声歯摩擦音 thin
v v 有声唇歯摩擦音 vest
w w 両唇軟口蓋接近音 west
z z 有声歯茎摩擦音 zero
ʒ Z 有声後部歯茎摩擦音 vision
母音
IPA X-SAMPA 説明
ə @ 中舌中央母音 arena
æ { 非円唇前舌狭めの広母音 trap
aI 二重母音 price
aU 二重母音 mouth
ɑ A 非円唇後舌広長母音 father
eI 二重母音 face
ɜ 3 非円唇中舌半広母音 nurse
ɛ E 非円唇前舌半広母音 dress
i i 非円唇前舌狭長母音 fleece
ɪ I 非円唇前舌め広めの狭母音 kit
əʊ @U 二重母音 goat
ɔ O 円唇後舌半広長母音 thought
ɔɪ OI 二重母音 choice
u u 円唇後舌狭長母音 goose
ʊ U 円唇後舌め広めの狭母音 foot
ʌ V 非円唇後舌半広母音 strut
ɒ Q 円唇後舌広母音 bother
ɛə E@ 二重母音 bear
ɪə I@ 二重母音 beer
ʊə U@ 二重母音 tour
追加の記号
IPA X-SAMPA 説明
ˈ " 第一アクセント Alabama
ˌ % 第二アクセント Alabama
. . 音節の境界 A.la.ba.ma

これらの記号は、英語(US)の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。英語(US)のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

子音
IPA X-SAMPA 説明
b b 有声両唇破裂音 bed
d d 有声歯茎破裂音 dig
d͡ʒ dZ 有声後部歯茎破擦音 jump
ð D 有声歯摩擦音 then
f f 無声唇歯摩擦音 five
g g 有声軟口蓋破裂音 game
h h 無声声門摩擦音 house
j j 硬口蓋接近音 yes
k k 無声軟口蓋破裂音 cat
l l 歯茎側面接近音 lay
m m 両唇鼻音 mouse
n n 歯茎鼻音 nap
ŋ N 軟口蓋鼻音 thing
p p 無声両唇破裂音 speak
ɹ r\ 歯茎接近音 red
s s 無声歯茎摩擦音 seem
ʃ S 無声後部歯茎摩擦音 ship
t t 無声歯茎破裂音 trap
t͡ʃ tS 無声後部歯茎破擦音 chart
θ T 無声歯摩擦音 thin
v v 有声唇歯摩擦音 vest
w w 両唇軟口蓋接近音 west
z z 有声歯茎摩擦音 zero
ʒ Z 有声後部歯茎摩擦音 vision
母音
IPA X-SAMPA 説明
ə @ 中舌中央母音 arena
ɚ @` R音性中舌中央母音 reader
æ { 非円唇前舌狭めの広母音 trap
aI 二重母音 price
aU 二重母音 mouth
ɑ A 非円唇後舌広長母音 father
eI 二重母音 face
ɝ 3` R音性非円唇中舌半広母音 nurse
ɛ E 非円唇前舌半広母音 dress
i i 非円唇前舌狭長母音 fleece
ɪ I 非円唇前舌め広めの狭母音 kit
oU 二重母音 goat
ɔ O 円唇後舌半広長母音 thought
ɔɪ OI 二重母音 choice
u u 円唇後舌狭長母音 goose
ʊ U 円唇後舌め広めの狭母音 foot
ʌ V 非円唇後舌半広母音 strut
追加の記号
IPA X-SAMPA 説明
ˈ " 第一アクセント Alabama
ˌ % 第二アクセント Alabama
. . 音節の境界 A.la.ba.ma

これらの記号は、フランス語(CA)の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。フランス語(CA)のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

子音
IPA X-SAMPA 説明
b b 有声両唇破裂音 bon
d d 有声歯茎破裂音 deux
f f 無声唇歯摩擦音 faire
g ɡ 有声軟口蓋破裂音 garçon
ɥ H 有声両唇硬口蓋接近音 huit
j j 硬口蓋接近音 travail
k k 無声軟口蓋破裂音 corps
l l 歯茎側面接近音 laisser
m m 両唇鼻音 même
n n 歯茎鼻音 nous
ɲ J 硬口蓋鼻音 gagner
ŋ N 軟口蓋鼻音 camping
p p 無声両唇破裂音 père
ʁ R 有声口蓋垂摩擦音 regarder
s s 無声歯茎摩擦音 sans
ʃ S 無声後部歯茎摩擦音 chance
t t 無声歯茎破裂音 tout
tS 無声後部歯茎破擦音 ciao
dZ 有声後部歯茎破擦音 Djakarta
v v 有声唇歯摩擦音 vous
w w 両唇軟口蓋接近音 oui
z z 有声歯茎摩擦音 zéro
ʒ Z 有声後部歯茎摩擦音 jamais
母音
IPA X-SAMPA 説明
i i 非円唇前舌狭母音 si
y y 円唇前舌狭母音 sûr
ɪ I 非円唇前舌め広めの狭母音 pipe
ʏ Y 円唇前舌め広めの狭母音 lutte
e e 非円唇前舌半狭母音 clé
ø 2 円唇前舌半狭母音 ceux
ɛ E 非円唇前舌半広母音 mettre
ɛː E: 非円唇前舌半広長母音 mtre
œ 9 円唇前舌半広母音 sœur
a a 非円唇前舌広母音 patte
ə @ 中舌中央母音 le
u u 円唇後舌狭母音 roue
ʊ U 円唇後舌め広めの狭母音 coupe
o o 円唇後舌半狭母音 bureau
ɔ O 円唇後舌半広母音 minimum
ɑ A 非円唇後舌広母音 châle
鼻母音
IPA X-SAMPA 説明
ɑ̃ A~ 非円唇後舌広鼻母音 champ
ɛ̃ E~ 非円唇前舌半広鼻母音 pain
œ̃ 9~ 円唇前舌半広鼻母音 parfum
ɔ̃ O~ 円唇後舌半広鼻母音 nom
外国語の音素
IPA X-SAMPA 説明
ɚ @` R音性中舌中央母音 reader
æ { 非円唇中舌半広母音 trap
ʌ V 非円唇後舌半広母音 bus
m= 音節両唇鼻音 rhythm
n= 音節歯茎鼻音 griffon
p_h 無声有気両唇破裂音 power
t_h 無声有気歯茎破裂音 torn
k_h 無声有気軟口蓋破裂音 cage
θ T 無声歯摩擦音 cloth
ð D 有声歯摩擦音 this
h h 無声声門摩擦音 hello
ɹ r\ 歯茎接近音 rice
ɫ l_e 歯茎側面接近音 feel

これらの記号は、フランス語(FR)の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。フランス語(FR)のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

子音
IPA X-SAMPA 説明
b b 有声両唇破裂音 bon
d d 有声歯茎破裂音 deux
f f 無声唇歯摩擦音 faire
g ɡ 有声軟口蓋破裂音 garçon
ɥ H 有声両唇硬口蓋接近音 huit
j j 硬口蓋接近音 travail
k k 無声軟口蓋破裂音 corps
l l 歯茎側面接近音 laisser
m m 両唇鼻音 même
n n 歯茎鼻音 nous
ɲ J 硬口蓋鼻音 gagner
ŋ N 軟口蓋鼻音 camping
p p 無声両唇破裂音 père
ʁ R 有声口蓋垂摩擦音 regarder
s s 無声歯茎摩擦音 sans
ʃ S 無声後部歯茎摩擦音 chance
t t 無声歯茎破裂音 tout
tS 無声後部歯茎破擦音 ciao
dZ 有声後部歯茎破擦音 Djakarta
v v 有声唇歯摩擦音 vous
w w 両唇軟口蓋接近音 oui
z z 有声歯茎摩擦音 zéro
ʒ Z 有声後部歯茎摩擦音 jamais
母音
IPA X-SAMPA 説明
a a 非円唇前舌広母音 patte
e e 非円唇前舌半狭母音 clé
ɛ E 非円唇前舌半広母音 faite
ə @ 中舌中央母音 le
i i 非円唇前舌狭母音 si
œ 9 円唇前舌半広母音 sœur
ø 2 円唇前舌半狭母音 ceux
o o 円唇後舌半狭母音 bureau
ɔ O 円唇後舌半広母音 minimum
u u 円唇後舌狭母音 roue
y y 円唇前舌狭母音 sûr
鼻母音
IPA X-SAMPA 説明
ɑ̃ A~ 非円唇後舌広鼻母音 champ
ɛ̃ E~ 非円唇前舌半広鼻母音 pain
œ̃ 9~ 円唇前舌半広鼻母音 parfum
ɔ̃ O~ 円唇後舌半広鼻母音 nom
外国語の音素
IPA X-SAMPA 説明
ð D 有声歯摩擦音 this
h h 無声声門摩擦音 hello
ɹ r\ 歯茎接近音 rice
θ T 無声歯摩擦音 cloth

これらの記号は、ドイツ語(DE)の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。ドイツ語のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

子音
IPA X-Sampa 説明
b b 有声両唇破裂音 Bier
d d 有声歯茎破裂音 Dach
ç C 無声硬口蓋摩擦音 ich
d͡ʒ dZ 有声後部歯茎破擦音 Dschungel
f f 無声唇歯摩擦音 Vogel
g g 有声軟口蓋破裂音 Gabel
h h 無声声門摩擦音 Haus
j j 硬口蓋接近音 jemand
k k 無声軟口蓋破裂音 Kleid
l l 歯茎側面接近音 Loch
m m 両唇鼻音 Milch
n n 歯茎鼻音 Natur
ŋ N 軟口蓋鼻音 klingen
p p 無声両唇破裂音 Park
p͡f pf 無声唇歯破擦音 Apfel
ʀ R 口蓋垂ふるえ音 Regen
s s 無声歯茎摩擦音 Messer
ʃ S 無声後部歯茎摩擦音 Fischer
t t 無声歯茎破裂音 Topf
t͡s ts 無声歯茎破擦音 Zahl
t͡ʃ tS 無声後部歯茎破擦音 deutsch
v v 有声唇歯摩擦音 Wasser
x x 無声軟口蓋摩擦音 kochen
z z 有声歯茎摩擦音 See
ʒ Z 有声後部歯茎摩擦音 Orange
母音
IPA X-Sampa 説明
a a 非円唇前舌広母音 Salz
a: 非円唇前舌広長母音 Sahne
aU 二重母音 Augen
ə @ 中舌中央母音 Rede
ɐ 6 中舌狭めの広母音 besser
aI 二重母音 nein
ɛ E 非円唇前舌半広母音 Kellner
e: 非円唇前舌半狭長母音 Rede
øː 2: 円唇前舌半狭長母音 böse
ɪ I 非円唇前舌め広めの狭母音 bitte
i: 非円唇前舌狭長母音 Lied
ɔ O 円唇後舌半広母音 Koffer
œ 9 円唇前舌半広母音 können
o: 円唇後舌半狭長母音 Kohl
ɔʏ OY 二重母音 neu
ʊ U 円唇後舌め広めの狭母音 Wunder
ʏ Y 円唇前舌め広めの狭母音 Küche
u: 円唇後舌狭長母音 Bruder
y: 円唇前舌狭長母音 kühl
集中二重母音
IPA X-Sampa
aɐ̯ a6_^ hart
aːɐ̯ a:6_^ Haar
ɛɐ̯ E6_^ Berg
eːɐ̯ e:6_^ schwer
øːɐ̯ 2:6_^ Nadelöhr
ɪɐ̯ I6_^ Wirtschaft
iːɐ̯ i:6_^ Tier
ɔɐ̯ O6_^ dort
œɐ̯ 96_^ Wörter
oːɐ̯ o:6_^ Ohr
ʊɐ̯ U6_^ Gurke
ʏɐ̯ Y6_^ Türkei
uːɐ̯ u:6_^ Kur
yːɐ̯ y:6_^ Tür
英語の音素
IPA X-Sampa 説明
ð D 有声歯摩擦音 brother
ɹ r\ 歯茎接近音 ripe
θ T 無声歯摩擦音 north
w w 両唇軟口蓋接近音 well
ɔː O: 円唇後舌半広長母音 callcenter
eI 二重母音 rating
oU 二重母音 windows
フランス語の音素
IPA X-Sampa 説明
ã: a~: 非円唇前舌広長鼻母音 Croissant
ɛ̃ː E~: 非円唇前舌半広長鼻母音 Terrain
õ: o~: 円唇後舌半狭長鼻母音 Annonce
追加の記号
IPA X-Sampa 説明
ˈ " 第一アクセント genau
. . 音節の境界 ver.stan.den

これらの記号は、ヒンディー語(IN)の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。ヒンディー語(IN)のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

ヒンディー語の子音
IPA XSAMPA 説明
p p 無声両唇破裂音 रिंदा
p_h 無声有気両唇破裂音 फूल (phool)
b b 有声両唇破裂音 बिस्तर
b_h 有声有気両唇破裂音 भारी (bhaari)
t_d 無声歯破裂音 तापमान (taapmaan)
t̪ʰ t_d_h 無声有気歯破裂音 थोड़ा (thoda)
d_d 有声歯破裂音 दिल्ली (dilli)
d̪ʱ d_d_h 有声有気歯破裂音 धोबी (dhobi)
ʈ t` 無声そり舌破裂音 टोरा (katora)
ʈʰ t`_h 無声有気そり舌破裂音 ठंड (thand)
ɖ d` 有声そり舌破裂音 र (darr)
ɖʱ d`_h 有声有気そり舌破裂音 ढाल (dhal)
tS 無声後部歯茎破擦音 चा
tʃʰ tS_h 無声有気硬口蓋破擦音 छाल (chaal)
dZ 有声後部歯茎破擦音 जंगल
dʒʱ dZ_h 有声有気硬口蓋破擦音 झाल (jhaal)
k k 無声軟口蓋破裂音 कमाल
k_h 無声有気軟口蓋破裂音 खान (khan)
g g 有声軟口蓋破裂音 गाँ
ɡʱ g_h 有声有気軟口蓋破裂音 घान (ghaan)
l l 歯茎側面接近音 म्हा
m m 両唇鼻音 मंत्र
n n 歯茎鼻音 ना
ŋ N 軟口蓋鼻音 मंगल
ɳ n` そり舌鼻音 क्ष (kshan)
s s 無声歯茎摩擦音 सा
z z 有声歯茎摩擦音 ज़रूर
ʃ S 無声後部歯茎摩擦音 र्मिंदा
f f 無声唇歯摩擦音 फ़ारसी
ɾ 4 歯茎はじき音 राम (ram)
ɽ r` 舌端そり舌はじき音 ड़ा (bada)
ɽʱ r`_h 有声有気そり舌はじき音 ढ़ी (barhi)
h h 無声声門摩擦音 हा
j j 硬口蓋接近音 या
ʋ v\ 両唇接近音 सूल (wasool)
ヒンディー語の母音
IPA XSAMPA 説明
ə @ 中舌中央母音 च्छा (achhaa)
ə̃ @~ 中段中舌鼻母音 हँसना (hansnaa)
a A 非円唇前舌広母音 ग (aag)
A~ 非円唇前舌広鼻母音 घड़ियाँ (ghariyaan)
ɪ I 非円唇前舌め広めの狭母音 क्कीस (ikkees)
ɪ̃ I~ 非円唇前舌め広めの狭鼻母音 सिंचाई (sinchai)
i i 非円唇前舌狭母音 बिल्ली (billee)
i~ 非円唇前舌狭鼻母音 हीं (nahin)
ʊ U 円唇後舌め広めの狭母音 ल्लू (ullu)
ʊ̃ U~ 円唇後舌め広めの狭鼻母音 मुँह (munh)
u u 円唇後舌狭母音 फूल (phool)
u~ 円唇後舌狭鼻母音 ऊँट (oont)
ɔ O 円唇後舌半広母音 कौन (kaun)
ɔ̃ O~ 円唇後舌半広鼻母音 भौं  (bhaun)
o o 円唇後舌半狭母音 सोना (sona)
o~ 円唇後舌半狭鼻母音 क्यों (kyon)
ɛ E 非円唇前舌半広母音 पैसा (paisa)
ɛ̃ E~ 非円唇前舌半広鼻母音 मैं (main)
e e 非円唇前舌半狭母音 क (ek)
e~ 非円唇前舌半狭鼻母音 किताबें  (kitabein)
英語の子音
IPA X-SAMPA 説明
b b 有声両唇破裂音 bed
d d 有声歯茎破裂音 dig
d͡ʒ dZ 有声後部歯茎破擦音 jump
ð D 有声歯摩擦音 then
f f 無声唇歯摩擦音 five
g g 有声軟口蓋破裂音 game
h h 無声声門摩擦音 house
j j 硬口蓋接近音 yes
k k 無声軟口蓋破裂音 cat
l l 歯茎側面接近音 lay
m m 両唇鼻音 mouse
n n 歯茎鼻音 nap
ŋ N 軟口蓋鼻音 thing
p p 無声両唇破裂音 speak
ɹ r\ 歯茎接近音 red
s s 無声歯茎摩擦音 seem
ʃ S 無声後部歯茎摩擦音 ship
t t 無声歯茎破裂音 trap
t͡ʃ tS 無声後部歯茎破擦音 chart
θ T 無声歯摩擦音 thin
v v 有声唇歯摩擦音 vest
w w 両唇軟口蓋接近音 west
z z 有声歯茎摩擦音 zero
ʒ Z 有声後部歯茎摩擦音 vision
英語の母音
IPA X-SAMPA 説明
ə @_o 中舌中央母音 arena
æ { 非円唇前舌狭めの広母音 trap
aI 二重母音 price
aU 二重母音 mouth
ɑ A_o 非円唇後舌広長母音 father
eI 二重母音 face
ɜ 3 非円唇中舌半広母音 nurse
ɛ E_o 非円唇前舌半広母音 dress
i i_o 非円唇前舌狭長母音 fleece
ɪ I_o 非円唇前舌め広めの狭母音 kit
əʊ @U 二重母音 goat
ɔ O_o 円唇後舌半広長母音 thought
ɔɪ OI 二重母音 choice
u u_o 円唇後舌狭長母音 goose
ʊ U_o 円唇後舌め広めの狭母音 foot
ʌ V 非円唇後舌半広母音 strut
ɒ Q 円唇後舌広母音 bother
ɛə E@ 二重母音 bear
ɪə I@ 二重母音 beer
ʊə U@ 二重母音 tour
追加の記号
IPA X-SAMPA 説明
ˈ " 第一アクセント Alabama
ˌ % 第二アクセント Alabama
. . 音節の境界 A.la.ba.ma

これらの記号は、イタリア語(IT)の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。イタリア語のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

X-SAMPA IPA
b b problema
tS pancia
d d diretto
dz dz benzina
f f difesa
g g erogazione
j j votazione
dZ legislatura
k k cascata
l l polvere
L ʎ dettaglio
m m settimo
n n comune
N ŋ anche
J ɲ dignità
p p pasta
r r promozione
s s vestito
S ʃ disciplina
t t articolo
ts ts esistenza
v v tuttavia
w w delinquenza
z z musicista
Z ʒ peugeot
i i musica
e e vestito
E ɛ veste
a a mano
u u uva
o o polacco
O ɔ povero
 . 音節の境界 rapido (" r a . p i . d o)
" 第一アクセント certo (" c ɛ r . t o)
 % 第二アクセント alfabeto (% a l . f a . " b e . t o)

これらの記号は、日本語の発音を完全に網羅しています。他の言語では、この一覧に含まれていない記号を使用する必要がありますが、そのような記号はサポートされません。日本語(日本)のスキルでは、この一覧に含まれている記号のみ使用することをお勧めします。一覧以外の記号を使用すると、最適ではない音声が生成される可能性があるからです。

子音
IPAX-SAMPA説明
bb有声両唇破裂音ボート(booto)
dd有声歯茎破裂音電車(densha)
gg有声軟口蓋破裂音学校(gakkoo)
hh無声声門摩擦音花火(hanabi)
jj硬口蓋接近音夢(yume)
kk無声軟口蓋破裂音会社(kaisha)
mm両唇鼻音メガネ(megane)
nn歯茎鼻音猫(neko)
pp無声両唇破裂音ピアノ(piano)
ss無声歯茎摩擦音寿司(sushi)
tt無声歯茎破裂音テレビ(terebi)
ww両唇軟口蓋接近音話題(wadai)
zz有声歯茎摩擦音雑貨(zakka)
ɸp\無声両唇摩擦音冬(fuyu)
çC無声硬口蓋摩擦音ヒント(hinto)
ɾ4歯茎はじき音冷蔵庫(reezooko)
t͡sts無声歯茎破擦音月(tsuki)
cc無声硬口蓋破裂音天気(tenki)
ɟj\有声硬口蓋破裂音将棋(shoogi)
ɕs\無声歯茎硬口蓋摩擦音紹介(shookai)
d͡ʑz\有声歯茎硬口蓋破擦音ジュース(juusu)
ɲJ硬口蓋鼻音日本(nihon)
ɺl歯茎側面はじき音リンゴ(ringo)
t͡ɕts\無声歯茎硬口蓋破擦音宇宙(uchuu)
QQQ促音ロボット(robotto)
ɴNN口蓋垂鼻音パソコン(pasokon
母音
IPAX-SAMPA説明
äa非円唇中舌広母音窓(mado)
ii非円唇前舌狭母音イス(isu)
ɯM非円唇後舌狭母音クジラ(kujira)
ee非円唇前舌中央母音世界(sekai)
oo円唇後舌中央母音お茶(ocha)
ä:a:非円唇中舌広長母音ギター(gitaa
i:i:非円唇前舌狭長母音チーム(chiimu)
ɯ:M:非円唇後舌狭長母音算数(sansuu
e:e:非円唇前舌中央長母音ケータイ(keetai)
o:o:円唇後舌中央長母音飛行機(hikooki)
子音
IPA X-SAMPA 説明
ɾ 4 歯茎はじき音 pira
b b 有声両唇破裂音 bato
d d 有声歯茎破裂音 dato
d͡ʒ dZ 有声後部歯茎破擦音 idade
f f 無声唇歯摩擦音 facto
g g 有声軟口蓋破裂音 gato
j j 硬口蓋接近音 paraguay
k k 無声軟口蓋破裂音 cacto
l l 歯茎側面接近音 galo
ʎ L 口蓋側面接近音 galho
m m 両唇鼻音 mato
n n 歯茎鼻音 nato
ɲ J 硬口蓋鼻音 pinha
p p 無声両唇破裂音 pato
s s 無声歯茎摩擦音 saca
ʃ S 無声後部歯茎摩擦音 chato
t t 無声歯茎破裂音 tacto
t͡ʃ tS 無声後部歯茎破擦音 noite
v v 有声唇歯摩擦音 vaca
w w 両唇軟口蓋接近音 mau
χ X 無声口蓋垂摩擦音 carro
z z 有声歯茎摩擦音 zaca
ʒ Z 有声後部歯茎摩擦音 jacto
母音
a a 非円唇前舌広母音 parto
a~ 非円唇前舌広鼻母音 pensamos
e e 非円唇前舌半狭母音 pega
e~ 非円唇前舌半狭鼻母音 movem
ɛ E 非円唇前舌半広母音 café
i i 非円唇前舌狭母音 lingueta
i~ 非円唇前舌狭鼻母音 cinto
o o 円唇後舌半狭母音 poder
o~ 円唇後舌半狭鼻母音 compra
ɔ O 円唇後舌半広母音 cotó
u u 円唇後舌狭母音 fui
u~ 円唇後舌狭鼻母音 sunto

prosody

タグで囲まれた音声の音量、高さ、速さを変更します。

アトリビュート 使用できる値

rate

音声の速さを変更します。

  • x-slowslowmediumfastx-fast 速さを定義済みの値に設定します。
  • n%:音声の速さを増減するパーセンテージを指定します。
    • 100%は、通常の速さのまま変更しないことを示します。
    • 100%より大きいパーセンテージは、速さを上げます。
    • 100%より小さいパーセンテージは、速さを下げます。
    • 指定できる最小値は20%です。

pitch

音声のトーン(高さ)を増減します。

  • x-lowlowmediumhighx-high: 高さを定義済みの値に設定します。
  • +n% 指定したパーセンテージだけ高さを上げます。例:+10%+5%指定できる最大値は+50%です​。+50%より大きい値は、+50%として適用されます。
  • -n% 指定したパーセンテージだけ高さを下げます。例:-10%-20%指定できる最小値は-33.3%です​。-33.3%より小さい値は、-33.3%として適用されます。

volume

音声の音量を変更します。

  • silentx-softsoftmediumloudx-loud: 音量を現在の声で定義済みの値に設定します。
  • +ndB: 現在の音量レベルを相対的に上げます。たとえば、+0dBでは、音量は変化しません。+6dBでは、現在の振幅がおよそ2倍になります。指定できる正の最大値は、およそ+4.08dBです。
  • -ndB: 現在の音量レベルを相対的に下げます。たとえば、-6dBでは、現在の振幅の半分ほどになります。

クリップボードにコピーされました。

<speak>
    最初の文は通常の音量です。
    <prosody volume="x-loud">2つめの文はより大きい音量です</prosody>。
    起きたときは <prosody rate="x-slow">とてもゆっくり話します</prosody>。
    普通の高さで話すこともできますが、
    <prosody pitch="x-high"> もっと高い声で話すこともできますし</prosody><prosody pitch="low">低い声も出せます</prosody></speak>

rate および/または volumeの属性を設定するときに、prosodyを他のすべてのタグと組み合わせることができます。pitch属性を使用する場合、prosody互換性のないタグを組み合わせることはできません。

s

センテンスを表します。このタグは、タグの前後にstrongの休止を入れます。

これは、次のような指定と同じです。

  • センテンスの末尾に句点(。)を置く。
  • <break strength="strong"/>を使用して休止を指定する。

クリップボードにコピーされました。

<speak>
    <s>これは文章です</s>
    <s>この二つめの文の前に短い一時停止が入ったはずです</s>
    この文は句点で終わるため、同じ一時停止が入ります。
</speak>

say-as

テキストを解釈する方法を記述します。これによってテキストに追加のコンテキストを提供できるため、Alexaがテキストを音声化する際の曖昧さを解消できます。Alexaがテキストを解釈する方法は、interpret-asアトリビュートで指定します。

アトリビュート 使用できる値

interpret-as

  • charactersspell-out: 文字ごとに発音します。
  • cardinalnumber: 値を基数として解釈します。
  • ordinal 値を順序数として解釈します。
  • digits 数字ごとに別々に発音します。
  • fraction 値を分数として解釈します。これは、常分数(3/20など)と帯分数(1+1/2など)に対して機能します。
  • unit 値を測定値として解釈します。値は、数値または分数のいずれかの後に単位が続く(単位の前にスペースを入れない)もののほか、単位だけも可能です。
  • date 値を日付として解釈します。形式はformatアトリビュートで指定します。
  • time 1'21"などの値を、分と秒で表した期間として解釈します。
  • telephone 値を7桁または10桁の電話番号として解釈します。この設定では、内線番号を処理することもできます(例:2025551212x345)。
  • address 値を住所の一部として解釈します。
  • interjection 値を間投詞として解釈します。Alexaは、このテキストをより感情豊かに話します。最適な結果を得るには、サポートされる間投詞だけを使用し、それぞれのspeechconを休止で囲んでください。例:<say-as interpret-as="interjection">わおぅ。</say-as>。Speechconは、以下にリストされた言語でサポートされます。
  • expletive タグで囲まれた内容を「ピーという音」で消します。

format

interpret-asdateに設定した場合にのみ使用します。日付の形式を指定する次のいずれかに設定します。

  • mdy
  • dmy
  • ymd
  • md
  • dm
  • ym
  • my
  • d
  • m
  • y

また、日付をYYYYMMDDの形式で提供した場合は、formatアトリビュートは無視されます。日付の一部を省略するには、疑問符(?)を組み込みます。たとえば、<say-as interpret-as="date">????0922</say-as>をAlexaが読むと、「9月22日」になります。

なお、このタグを指定しない場合でも、Alexaサービスは、提供されたテキストをフォーマットに基づいて正しく解釈しようとします。たとえば、出力音声に「202-555-1212」が含まれている場合、Alexaは、数字の各桁を発音し、各ダッシュのところで短い休止を入れます。この場合は、<say-as interpret-as="telephone">を使用する必要がありません。ただし、「2025551212」というテキストを提供した場合に、これを電話番号として発音するようにAlexaに指示するには、<say-as interpret-as="telephone">を使用する必要があります。

クリップボードにコピーされました。

<speak>
    基数として発音される数字の例です。
    <say-as interpret-as="cardinal">12345</say-as>。
    同じ数字を別々に発音した例です。
    <say-as interpret-as="digits">12345</say-as>。
    単語をスペルアウトする例です。<say-as interpret-as="spell-out">hello</say-as>
</speak>

サポートされるspeechcon

Speechconは言語固有です。各スキル言語で使用できるSpeechconについては、次のページを参照してください。

speak

これは、SSMLドキュメントのルート要素です。Alexa Skills KitでSSMLを使用する場合は、話すテキストをこのタグで囲んでください。

<speak>
    SSMLがないとAlexaはこんな風に聞こえます。
</speak>

sub

指定した単語またはフレーズを、異なる単語またはフレーズとして発音します。置き換えて発音する語句は、aliasアトリビュートで指定します。

アトリビュート 使用できる値

alias

タグで囲まれたテキストの代わりに話す単語またはフレーズ。

この例では、省略形の化学元素を完全な単語に置き換えます。

クリップボードにコピーされました。

<speak>
    私が好きな化学元素は<sub alias="アルミニウム">Al</sub>ですが、
    Alは<sub alias="マグネシウム">Mg</sub>の方が好きなのです。
</speak>

voice

指定したAmazon Pollyの音声でテキストを読み上げるにはvoiceタグを使用します。それぞれの音声にはそれぞれの個性があります。スキルで複数の音声を使用して優れたユーザーエクスペリエンスを生み出す方法については、スキルにAmazon Pollyの音声を使用するためのユーザーエクスペリエンスガイドラインを参照してください。

voiceタグは互換性のないタグ以外のすべてのタグと組み合わせることができます。

アトリビュート 使用できる値

name

サポートされているAmazon Polly音声の名前です。音声は、ロケール固有です。スキルと同じ言語でコンテンツを読み上げるには、スキルのロケールでサポートされている音声を選択してください。別の言語でコンテンツを読み上げるには、voiceタグとlangタグを組み合わせてください。

たとえば、英語(US)スキルの場合、英語のコンテンツにはen-USの音声を使用します。フランス語のコンテンツにはfr-FR音声を使用できますが、正しいフランス語で読み上げるにはvoiceタグをlangタグと組み合わせる必要があります。

各ロケールでサポートされている音声の一覧は、サポートされているAmazon Polly音声を参照してください。

サポートされているAmazon Polly音声

この表はAlexaでサポートされるAmazon Pollyの音声の一覧です。音声名の中にアクセント符号付き文字は含まれません。スキルのロケールでサポートされている音声を使うか、音声をlangタグと組み合わせて使ってください。

Alexaスキルのポリシーに適合するには、Amazonによって割り当てられたPolly音声の名前をユーザーに公開しないでください。

ロケール サポートされる音声

英語、米国(en-US)

Ivy、Joanna、Joey、Justin、Kendra、Kimberly、Matthew、Salli

英語、オーストラリア(en-AU)

Nicole、Russell

英語、英国(en-GB)

Amy、Brian、Emma

英語、インド(en-IN)

Aditi、Raveena

英語、ウェールズ語(en-GB-WLS)

Geraint

フランス語、カナダ(fr-CA)

Chantal

フランス語、フランス(fr-FR)

Celine、Lea、Mathieu

ドイツ語(de-DE)

Hans、Marlene、Vicki

ヒンディー語(hi-IN)

Aditi

イタリア語(it-IT)

Carla、Giorgio、Bianca

日本語(ja-JP)

Mizuki、Takumi

ポルトガル語、ブラジル(pt-BR)

Vitoria、Camila、Ricardo

スペイン語、米国(en-US)

Penelope、Lupe、Miguel

スペイン語、カスティリャ(es-ES)

Conchita、Enrique、Lucia

スペイン語、メキシコ(es-MX)

Mia

サンプル – 標準のAlexa音声と指定したAmazon Pollyの音声

この例では、「Kendra」はen-USの音声でlangタグが不要なため、このサンプルがen-USのスキルからのものであると想定しています。このサンプルがen-USロケールのないスキルのものだった場合、langタグを追加してen-USに設定する必要があります。

クリップボードにコピーされました。

<speak>
    秘密を教えましょう。
    <voice name="Mizuki">私は本当の人間ではないのです</voice>。
    信じられますか?
</speak>

サンプル–ダイアログで2種類の音声を使用する

この例は、英語(US)の音声と英語(UK)の音声の間のダイアログです。たとえば、2人の異なるキャラクターが登場する物語が読まれる場合などに使えます。標準のAlexaの音声(ロケールによって異なる)は最初と最後の文を読み上げます。

クリップボードにコピーされました。

<speak>
    Here's a surprise you did not expect. 
    <voice name="Kendra"><lang xml:lang="en-US">I want to tell you a secret.</lang></voice>
    <voice name="Brian"><lang xml:lang="en-GB">Your secret is safe with me!</lang></voice>
    <voice name="Kendra"><lang xml:lang="en-US">I am not a real human.</lang></voice>.
    信じられますか?
</speak>

以下の例では、デフォルトのAlexa音声が英語(US)のスキルに使われます。スキルがen-GB向けの場合、デフォルトのAlexa音声はそれに対応したものになります。

例:英語のスキルでフランス語のコンテンツを使用する

この例では、このスキルのロケールが英語を話す地域向けであると想定しています。「Celine」はフランス語(FR)の音声であり、Celineのコンテンツはフランス語で話してほしいと考えているため、langタグは「fr-FR」に指定する必要があります。

クリップボードにコピーされました。

<speak>
    Welcome to Ride Hailer. <voice name="Celine"><lang xml:lang="fr-FR">Bienvenue à Ride Hailer</lang></voice>
    配車または料金の見積もりをリクエストできます。
    どちらにしますか?
</speak>

Amazon Pollyの音声を使う場合のヒント

Amazon Pollyの音声はすべて、ほぼ同じ音量を使用していますが、一部Alexaの音声よりも大きく聞こえるものも、小さく聞こえるものもあります。選択した音声の音量、速さ、高さを変更するには、prosodyタグを使用します。Alexaでサポートされる他のSSMLタグも、音声出力を変更するのに使用できます。

開発者は、デフォルトのAlexa音声に加えて1つ以上のAmazon Pollyの音声を含む応答でスキルを強化したり、特定の応答に特定の音声を選択したりすることができます。スキルでAmazon Pollyの音声を使用する場合のガイドラインについては、スキルにAmazon Pollyの音声を使用するためのユーザーエクスペリエンスガイドラインを参照してください。

Alexaの開発者は、Amazon Pollyの音声を無料で使用できます。

スキルのロケールは地域と言語の組み合わせを表し、すべてのAmazon Pollyの音声はロケールにタグ付けされています。たとえば、「en-AU」ロケールはオーストラリアの英語を表し、「en-IN」はインドの英語を表します。スキルのロケールは最初にスキルを作成するときに選択します。

スキルで指定したのと異なるロケールの音声を選択する場合、最適な結果を得るには、その音声を再生するコンテンツの言語をlangタグを使って指定します。詳細については、langタグを参照してください。

スキルの応答で別のロケールの音声を組み合わせて使う場合は、ユーザーエクスペリエンスに細心の注意を払ってください。

voiceタグのNode.jsサンプルコード

Node.jsスキルを作成する場合、voiceタグで音声出力を囲んで特定の音声を取得するために、このswitchVoice関数を使用できます。Alexa Skills Kit SDK for Node.jsを使用する場合はSDKによって処理されるため、音声出力を<speak>タグで囲む必要はありません。

function switchVoice(text,voice_name) {
  if (text){
    return "<voice name='" + voice_name + "'>" + text + "</voice>"
  }
}

以下は、switchVoice関数で複数の音声を使うスキルの音声出力サンプルです。

const speechOutput = "私はアレクサです。" + switchVoice("I am Matthew.","Matthew") + switchVoice("I am Kendra.","Kendra") + switchVoice("and I am Ivy.","Ivy") + "すばらしいチームでしょう?"

スキルの応答すべてを特定の音声で言うようにしたい場合、スキルのすべての音声出力をSSMLで指定し、適切なvoiceタグで囲むようにしてください。

w

このタグは、<say-as>と類似した働きをし、単語の品詞を指定することによって単語の発音をカスタマイズします。

アトリビュート 使用できる値

role

次のいずれかに設定します。

  • amazon:VB 単語を動詞(現在形)と解釈します。
  • amazon:VBD 単語を過去分詞として解釈します。
  • amazon:NN 単語を名詞として解釈します。
  • amazon:SENSE_1 単語をデフォルト以外の意味で使用します。たとえば、「bass」という名詞は、意味に応じて発音が異なります。この単語の「デフォルト」の意味は、音楽の最も低い音域のパートです。別の意味は(これも名詞)は、淡水魚の一種です。<speak><w role="amazon:SENSE_1">bass</w>"</speak>と指定すると、デフォルト以外の発音(淡水魚)が適用されます。

クリップボードにコピーされました。

<speak>
    <say-as interpret-as="characters">read</say-as>という単語は、
    単数現在形の<w role="amazon:VB">read</w>、
    または過去分詞形の<w role="amazon:VBD">read</w>のいずれかとして解釈されます。
</speak>

ここで取り上げたタグは、以前は、アトリビュート名でivonaネームスペースを使用していたことにご注意ください。タグには後方互換性があるため、ivonaネームスペースを使用して記述された既存のSSMLも引き続き機能します。


このページは役に立ちましたか?

最終更新日: 2023 年 05 月 16 日