人との自然な会話を思い浮かべてみてください。自然な会話は通常、スムーズで協力的に進んでいきます。次に何が起きるかを考えることなく、ただ話すだけです。ユーザーとAlexaの間でこのような自然な会話を再現するのは、とても難しい課題です。人が交わす会話は、シナリオもなく微妙に変化し、トピックも多岐にわたります。Alexa Conversationsは、このような微妙な変化の多くを処理します。
以下のセクションでは、Alexa Conversationsのしくみ、ユーザーの行動や期待の認識、いくつかのベストプラクティスについて説明します。このコンテンツをガイドとして使用して、自然でシームレスなサンプルダイアログをデザインしてください。
Alexa Conversationsは人工知能(AI)駆動型エンジンです。サンプルダイアログでトレーニングすることで、シミュレーションダイアログを作成できます。シミュレーションダイアログはターンベース形式で、ユーザーとAlexaの間の幅広いユーザー応答を表します。AIエンジンによって、さまざまな発話の出力、代名詞の解釈、コンテキストのキャリーオーバー、過不足のある応答の処理、ユーザーによる修正の調整が行われます。
Alexa Conversationsでは、ユーザーの行動が十分に把握されています。サンプルダイアログでこれらの行動の例をいくつか示すと、Alexa Conversationsにより、スキルはさまざまなユーザー入力を処理できるようになります。
人が何かを話す場合、その内容の背後には意図があります。ユーザーの背景、環境、心理状況は、考慮すべき要素の一部にすぎません。
ケーキの注文をお願いします
ケーキをください
人は話すときに、話題が飛躍したり、以前の話題に戻ったりすることがよくあります。会話の中で「それ」「あれ」などの代名詞を使って繰り返しを避けながら、前のトピックに言及することもあります。Alexa Conversationsは、推測されたコンテキストを処理し、自然な流れでダイアログを続行できるようにします。
8号のチョコレートケーキを注文して
わかりました。アイシングは何にしますか?
それは何人分?
8号のケーキは約10人分です
それの9号にして
9号のチョコレートケーキですね。わかりました。アイシングは何にしますか?
多くのユーザーが、音声エクスペリエンスは会話の1ターンで1つのトピックや質問しか言えず、柔軟性に欠けると思っています。また、音声エクスペリエンスには時間がかかり、フラストレーションがたまるという印象を持つこともあります。ユーザーはもっと情報を提供したい、もっと関連性の高い質問をしてほしいと考えているためです。
次の例は、情報が過剰な回答をAlexa Conversationsで処理する方法を示しています。このケースでは、スキルは大きさのみを聞いていますが、ユーザーは大きさとフレーバーを答えています。Alexa Conversationsでは、受け取ったユーザーインプットを次に必要になる情報として収集して会話を続けます。
ケーキの大きさはどうしますか?
バタークリームアイシングの8号のチョコレートケーキを注文したい
バタークリームの8号のチョコレートケーキですね。わかりました。ほかにご注文はありますか?
ユーザーが質問を誤解している場合や、質問の一部しか聞いていない場合があります。会話を進めるために、Alexaは与えられた情報を受け取り、不足している情報をユーザーにたずねます。
次の例は、情報が不足している回答をAlexa Conversationsで処理する方法を示しています。この場合、スキルは大きさとフレーバーをたずねていますが、ユーザーはフレーバーのみを回答しています。Alexaは、不足している大きさの情報を次にたずねて情報を補います。
最初のケーキの大きさとフレーバーを教えてください
チョコレート
どの大きさにしますか?
8号
会話は直線的に進むわけではありません。回答した後で、ユーザーの気が変わる可能性があります。このような状況で、ユーザーはスキルを終了してやり直す必要はありません。どの部分かを指定しなくても、訂正はワンステップで行われます。次の例では、ユーザーがケーキの大きさを変更しています。
バタークリームアイシングの8号のチョコレートケーキですね。ほかにご注文はありますか?
やっぱり、9号にして
わかりました。バタークリームアイシングの9号のチョコレートケーキですね。それ以外はどうですか?
Alexa Conversationsモデルのトレーニング時に、次のクイックリファレンス表を参考にして、ユーザー行動ダイアログのタイプをデザインしてください。
ユーザーの行動 | ダイアログの例 |
---|---|
同じ考えを表現するのにさまざまなフレーズを使用する |
ユーザー:「ケーキの注文をお願い」、「ケーキを注文して」 |
代名詞とコンテキストキャリーオーバーを使用する |
ユーザー:8号のチョコレートケーキを注文して Alexa:わかりました。アイシングは何にしますか? ユーザー:それは何人分? Alexa:8号のケーキは約10人分です |
質問に対して過剰に回答する |
Alexa:ケーキの大きさはどうしますか? ユーザー:バタークリームアイシングの8号のチョコレートケーキ Alexa:バタークリームの8号のチョコレートケーキですね。わかりました。ほかにご注文はありますか? |
質問に対する回答が足りない |
Alexa:最初のケーキの大きさとフレーバーを教えてください ユーザー:チョコレート Alexa:どの大きさにしますか? |
ユーザー自身が修正する |
Alexa:バタークリームアイシングの8号のチョコレートケーキですね。ほかにご注文はありますか? ユーザー:やっぱり、9号にして Alexa:わかりました。バタークリームアイシングの9号のチョコレートケーキですね。それ以外はどうですか? |
Alexa Conversationsは、次のようなユーザーの期待を認識します。これらの期待を理解することで、モデルのトレーニング時にデザインできる応答の種類を把握できます。
Alexaの応答に変化を付けると、機械的で退屈な印象がなくなり、楽しく会話を続けることができます。たとえば、今日のおすすめを提示する場合にも、いくつかのバリエーションがあります。
今日はお客様のためにあらゆる種類のおいしいケーキをご用意しています
お客様へのおすすめがたくさんあります
アイテムの購入など、リスクの高い特定のシナリオでは、ユーザーの選択を明示的に確認する応答が必要です。Alexaは正しく聞き取ったことを確認できます。聞き取れなかった場合は、ユーザーに再度回答するよう促します。
おすすめのチーズケーキを買いたい
わかりました。おすすめのチーズケーキを1つご注文ですね?
はい
修辞疑問文でない限り、ほとんどの人は相手が応答できると考えて質問します。ユーザーがスキルに質問するのは、スキルがその質問に回答できると信じているからです。次の例では、おすすめをたずねるユーザーへの返答を示しています。このユーザーは以前にこのスキルを使用したことがあるため、Alexaは以前の注文情報を注文履歴APIに保存しています。別のAPIからおすすめを呼び出すときに、その情報を使用します。Alexaはこの複雑な処理をユーザーには見せません。
今日のおすすめは?
おすすめがたくさんあります。 以前のご注文を参考にすると、新作のジャーマンチョコレートケーキが特におすすめです
ユーザーが目標を達成したら、新しい目標の開始をユーザーに提案するプロアクティブな情報を提供すると有益な場合があります。たとえば、次のスキルでは、ユーザーがケーキのデリバリー注文を完了した後、注文を追跡することを提案しています。
ご注文は以上でよろしいですか?
はい
わかりました。チーズケーキ1つを30分ほどでお届けします。 ご注文の配達状況を追跡しますか?
このクイックリファレンスは、Alexa ConversationsでデザインできるAlexaの応答タイプの参考になります。
ユーザーがAlexaに期待すること | ダイアログの例 |
---|---|
バリエーションの提供 |
Alexa:今日はお客様のためにあらゆる種類のおいしいケーキをご用意しています Alexa:お客様へのおすすめがたくさんあります |
ユーザーの発話を正しく聞き取れたことの確認 |
ユーザー:おすすめのチーズケーキを買いたい Alexa:わかりました。おすすめのチーズケーキを1つご注文ですね? ユーザー:はい |
ユーザーに関する情報の記憶 |
ユーザー:今日のおすすめは何? Alexa:おすすめがたくさんあります。以前のご注文を参考にすると、新作のジャーマンチョコレートケーキが特におすすめです |
会話を続ける |
Alexa:ご注文は以上でよろしいですか? ユーザー:はい Alexa:わかりました。チーズケーキ1つを30分ほどでお届けします。ご注文の配達状況を追跡しますか? |
ダイアログを作成する前に、より広範なコンテキストでスキルを検討することが重要です。ダイアログのデザイン開始時に、ロードマップとして次の質問に答えてください。
スキルの目的は何か?
目的はダイアログの方向を示す原則で、これを基にAIをトレーニングします。たとえば、ケーキ注文スキルの目的は、ユーザーが自宅でくつろぎながら、カスタマイズしたケーキを注文して届けてもらうことです。
ユーザーのゴールは何か?
このエクスペリエンスからユーザーは何を得られるでしょうか。 ゴールが決まると、主要なダイアログがわかります。たとえば、ピザ注文スキルの場合、決められた選択肢からピザを注文することや、好みのピザをカスタマイズすることがゴールです。
目的とゴールを明確に把握したら、ゴールデンダイアログの作成を開始できます。ゴールデンダイアログは、ユーザーのゴールを達成するために期待される会話の最適なユーザージャーニー(「ハッピーパス」とも呼ばれます)を示すものです。
ユーザーがケーキを注文する場合のゴールデンダイアログの例を次に示します。
8号のチョコレートケーキを注文して
わかりました。アイシングは何にしますか?
バタークリーム
わかりました。バタークリームアイシングの8号のチョコレートケーキを1つですね
会話は、さまざまな方法で元のトピックから分岐します。Alexa Conversationsは、コンテキストの切り替えや誤りの修正を処理できますが、分岐ダイアログを書き出しておくと便利です。これらは、予期しない経路でユーザーがゴールに到達する多くの事例に対応するために、理解エンジンをトレーニングするのに役立ちます。
分岐ダイアログをデザインする際の考慮事項は、次の通りです。
ここでは、ユーザーがケーキを注文するときの分岐ダイアログの例をいくつか示します。
8号のチョコレートケーキを注文して
わかりました。アイシングは何にしますか?
(応答なし)
バタークリーム、ガナッシュ、フォンダンなど、さまざまなアイシングがあります。どのアイシングがいいですか?
8号のチョコレートケーキを注文して
残念ながら、注文システムがダウンしているようです。レストランに電話しましょうか?