開発者コンソール

発話の概要


発話の概要

発話とは、ユーザーがAlexaに話しかけるフレーズのことです。ここでは、発話とローカライズの全般的な概念について説明します。ロケールごとのAlexaインターフェースによるすべての発話のリファレンスについては、発話リファレンスを参照してください。

ロケールごとの発話の選択

以下の発話では、言語のセレクターから対象とする言語を選択できます。一部のロケールはまだサポート対象外ですが、これらの地域でもビデオスキルを早期開発できるように、ローカライズされた発話が提供されています。サポートされているロケールの詳細については、サポート対象国を参照してください。

ローカライズされた発話では、「エンティティ」もローカライズされることに注意してください。 エンティティは、その地域の番組、チャンネル、俳優、映画などを指します。たとえば、「スポーツのチームで再生」機能では、対象となるチーム名が英語、ドイツ語、イタリア語でそれぞれ異なります。以下に例を示します。

  • 英語: Watch seahawks
  • ドイツ語: Erster. FC Heidenheim, Erster FC Heidenheim, Erster FC Kaiserslautern
  • イタリア語: Aberdeen, ac milan

エンティティのローカライズとは、このようなことを意味します。Alexa言語チームは、Alexaがサポートするロケールごとにエンティティのリストを収集します。これらのエンティティを使用することで、Alexaは、発話のエンティティスロットに収まる用語の認識を向上させることができます。

ロケールのグループ化

ロケールセレクターで異なるロケールを選択すると、一部のロケールがグループ化されていることがわかります。英語にはen-US、en-GB、en-IN、en-NZ、en-IEのロケールがありますが、ロケールセレクターには「英語(すべてのロケール)」と表示されます。 この場合、これらのロケール間の発話に大きな違いはないため、これらはグループ化されています。

スペイン語の場合も同様です。es-ES、es-MX、es-USには大きな違いがないため、「スペイン語(すべてのロケール)」としてグループ化されています。 また、ドイツ語でも、de-DEとde-ATは同じように扱われるため、ロケールセレクターでは「ドイツ語(すべてのロケール)」としてグループ化されています。

違いがあるのは、fr-FRとfr-CAだけです。フランス語のロケールの場合、フランスとカナダでは発話に違いがあるため、ロケールセレクターには異なるオプションとして表示されます。

また、ロケールセレクターには利用可能なすべてのロケールが表示されますが、一部のロケールはサポートされていない場合があります。公式にサポートされているロケールの一覧については、サポート対象国を参照してください。たとえば、es-ES、es-MX、es-USのすべてがサポートされているわけではありません。es-ESはサポートされていますが、es-MXはパブリックベータ版であり、es-USはサポート対象外です(2020年7月現在)。それでも、ロケールセレクターには「スペイン語(すべてのロケール)」と表示されます。ローカライズされた発話は、それらの地域でビデオスキルを早期開発できるように提供されています。

さまざまなロケールでの複数の発話

また、ロケールには複数のバージョンの発話がある場合と、バージョンが1つしかない場合があります。各ロケールで最も一般的な発話のみが表示されるのが理想です。現在、複数のバージョンの発話を1つか2つに減らす作業を進めています。今のところ、各ロケールで機能する複数の発話(使用可能な場合)から、いずれかの発話を選択できます。

統計的マッチングと決定論的マッチング

発話には、決定論的マッチングを使用するものと、統計的マッチングを使用するものがあります。その違いを知ることは重要ではありませんが、決定論的マッチングは、本質的にはフレーズのハードコーディングと似ています。Alexaは、「アレクサ、やめて」など、特定のフレーズとの完全一致をリッスンします。

これに対して、統計的マッチングはあいまいマッチングであり、Alexaは認識された特定の用語を選び出し、ユーザーのインテントを推測しようとします。自然な会話ではフレーズの順序が無限に変化することを考えると、すべてのフレーズをハードコーディングすることは不可能です。そのため、Alexaが発話のインテントを特定するのに役立つ自然言語アルゴリズムが利用されます。

このアルゴリズムの要素の1つは入力デバイスです。ユーザーが「『ロケットマン』を再生して」(楽曲と映画の両方がある)と話しかけた場合、このアルゴリズムではユーザーがオーディオスピーカー(Echo)とFire TVのどちらに話しかけているかが考慮され、このデバイスを使用してインテントが通知されます。

バージョンのサポート

バージョンに関する情報は、発話リファレンスにも記載されています。Lambdaでは、Discoverディレクティブに応答する際、各インターフェースでサポートしているバージョンを指定します。AlexaからLambdaに送信される発話は、このバージョンによって決まります。VSKバージョン3.0で新しい発話が導入されたとしても、Lambdaが2.0のサポートを指定している場合、Alexaは3.0の発話のディレクティブを送信しません。