Amazon Alexaのような音声ユーザーインターフェース(VUI)の登場は、従来のテクノロジーを徐々に進化させるのではなく、人とコンピューターの対話を飛躍的に変化させるものでした。そのため、スキルをデザインすることは、従来のグラフィカルユーザーインターフェース(GUI)のアプリをデザインすることとは大きく異なります。GUIの代わりとしてスキルを設計するのではなく、デザインアプローチ全体を変更する必要があります。スキルのデザインでは、会話形式の音声ファーストの対話を実現するとともに、GUIとタッチ操作などのインタラクションを提供して、ユーザーとの対話を充実させます。
このAlexaデザインガイドは幅広い内容を取り上げており、内容に応じて複数のセクションに分かれています。満足度の高い効果的なAlexaエクスペリエンスをデザインするのに役立ちます。まず最初に、Alexaスキルをデザインする際に留意すべき4つのデザイン原則について説明します。
自宅では、Alexaのマルチモーダルプラットフォームとしての強みがユーザーに高く評価されています。Alexaはモダリティに対応しており、ユーザーが話しかけるとAlexaデバイスは音声で応答します。ユーザーがスマートスクリーンに触れて操作する場合、Alexaは音声での応答を控えます。モダリティを認識することで、ユーザーの手がふさがっていれば遠隔対話の機能を利用し、ユーザーがデバイスに手の届く範囲内にいるときにはタッチ操作に対応することもできます。
スマートスクリーンデバイス用のAlexa Presentation Language(APL)ウィジェットの追加により、ユーザーはコンテンツと機能を見やすく表示した自動更新ビューを利用できるようになりました。このビューでは、現在の画面コンテキストから離れることなく、ユーザーがクイックアクションを実行できます。ウィジェットの操作には、タッチまたは音声のモダリティを選択できます。
Alexaは、ユーザーの移動方法に関係なく、インテリジェントに周囲の世界を探索し、ナビゲートできます。徒歩、自転車、車、電車、バス、飛行機のいずれの場合でも、Alexaはデバイスと環境に適応します。これにより、パーソナライズやプロアクティブな対応が可能なユーザーエクスペリエンスを実現できます。
外出先でのエクスペリエンスをより簡単にデザインする方法の1つは、イベントによるトリガーを使用することです。イベントによるトリガーを使用すると、ユーザーのおおよその位置情報と現在のアクティビティ(ウォーキング、ジョギング、ランニング、運転など)をAlexaに認識させることができます。これらのトリガーにより、Alexaはユーザーのアクティビティや位置情報に基づいてプロアクティブな提案を開始できます。食料品店で注文した商品の準備ができたらユーザーにプロアクティブな提案をする、ユーザーがランニングを開始したらワークアウト用のプレイリストを提案するなどのエクスペリエンスを作成できます。
音声言語は、Alexaとの会話を通じて目標を達成するための最も自然な方法です。Alexaでは会話型言語を使用して、ユーザーがどのデバイスでも対話できるようにします。Alexaエクスペリエンスを作成するときは、ユーザーが新しい特定のフレーズを習得しなくても自然言語を使用できるようにします。
人との会話では、自然なやり取りが行われます。あなたが何かを言うと、相手はそれを理解・処理して、両者が理解できる簡潔な方法で応答します。Alexaスキルも、ユーザーの発話に適切に対応し、共感できる方法で自然に応答する必要があります。
次の不自然な会話の例を見てみましょう。この例では、ユーザーがAlexaにおすすめの映画をたずねています。
アレクサ、今日のおすすめの映画は?
すみません、よくわかりません。
アレクサ、ムービーチケットを開いて
ムービーチケットへようこそ。このスキルでは、映画のチケットを購入したり、自宅で見るおすすめの映画を探すことができます。 ホラー、ロマンス、アクション、ドラマ、SF、コメディー、ドキュメンタリー、アニメーション、スリラーなど、さまざまな映画があります
うわぁ!たくさんあるんだね。うーん。トム・ハンクスのコメディが見たいな
おすすめのコメディ映画が500本以上あります。ヴィオラ・デイビスやロビン・ウィリアムズなど、主演俳優で絞り込むことができます
トム・ハンクス
わかりました。「メイフィールドの怪人たち」、「ビッグ」、「マネーピット」、「めぐり逢えたら」、「ターナー&フーチ/すてきな相棒」、「ジョー、満月の島へ行く」をお勧めします
「めぐり逢えたら」ってどんな話?
すみません、よくわかりません。
「めぐり逢えたら」ってどんな映画?
「めぐり逢えたら」を再生します
アレクサ、止めて
今度は自然な会話の例を見てみましょう。
アレクサ、今日のおすすめの映画は?
ロマンチックコメディがお好きなようなので、「ブリジット・ジョーンズの日記」はいかがですか?
いや、それは見たくないな
わかりました。今、どんなものが見たいですか?
トム・ハンクスのコメディが見たいな
「めぐり逢えたら」がおすすめです。この映画をご覧になりますか?
それはどんな話?
トム・ハンクス演じるサムという主人公が妻を亡くし、息子と一緒にシアトルに引っ越します。息子はラジオ番組に電話をかけ、父親に新しい奥さんを見つけるのを手伝ってもらおうとします。メグ・ライアン演じる新聞記者は、ラジオ番組でサムの話を聴いて惹かれていきます。いかがですか?
いいね。それを見るよ
後者のムービーチケットのエクスペリエンスのように自然な会話を行うには、留意すべき重要な概念がいくつかあります。
テキストメッセージを書くのと同じようにAlexaスキルを記述するのは簡単ですが、書き言葉と話し言葉は異なります。話し言葉は簡潔です。通常の会話では、スピードアップのために言葉を省略することがよくあります。少し沈黙したり、イントネーションを変えたりして、自分の感情を表現することもあります。また、自分の発言を繰り返さないようにします。ダイアログが適切かどうかを試す最良の方法は、1人がAlexa、もう1人がユーザーになって、実際にセリフを言ってみることです。自然な流れのダイアログを作成したら、Alexa Presentation Language for Audioを使用して、言葉づかいや応答をカスタマイズできます。
おすすめの映画はたくさんあります。ホラー、ロマンス、アクション、ドラマ、SF、コメディー、ドキュメンタリー、アニメーション、スリラーなど、さまざまな映画があります
通常、ユーザーがAlexaと対話するときは、探している対象が頭にあります。リクエストを実行できるスキルの名前をユーザーが知っているとは限りません。無指名対話ツールキット(日本語未対応)のプレビューにサインアップすると、ユーザーは開発者のスキルをより簡単に見つけられるようになります。Alexaは、キーワード、スキルの説明、カテゴリーを使用して、タスクに最も関連性の高いスキルを表示します。
アレクサ、ムービーレコメンダーを開いて。
アレクサ、今日のおすすめの映画は?
ユーザーはさまざまな方法で話しますが、その話し方にはパターンがあります。たとえば、同じことをさまざまなフレーズで説明する、代名詞を使用する、質問に対する回答に過不足がある、回答を自分で訂正するなどです。これらのすべてに適応することは難しいように思えるかもしれませんが、Alexa Conversationsを使用すると、この処理が容易になります。Alexa Conversationsは人工知能(AI)駆動型エンジンです。数種類のサンプルダイアログでトレーニングすることで、幅広い音声動作を表すシミュレーションダイアログを生成します。
どんなジャンルがいいですか?
トム・ハンクスのコメディが見たいな
俳優はだれがいいですか?
トム・ハンクス
どんなジャンルがいいですか?
トム・ハンクスのコメディが見たいな
「めぐり逢えたら」がおすすめです
Alexa AI駆動型ツール(Alexa Conversationsなど)を試して音声言語への対応を強化し、ユーザーとAlexaの間の会話フローを改善しましょう。
詳細については、以下を参照してください。
Alexa Conversationsによるユーザー対話の理解と、サンプルダイアログのデザイン方法に関するベストプラクティスについては、こちらをご覧ください。
リアルタイムでAlexaのAIを使用して、ダイアログで適切な応答を自動的に生成する方法については、こちらをご覧ください。
Alexaとの自然な会話を構築するには、ユーザーを理解し、ユーザーのニーズに合わせてデザインする必要があります。必要に応じてコミュニケーションをパーソナライズする場合は、Alexaとユーザーの関連性・親密性を高めます。複数のユーザーがAlexaと対話している場合は共用コミュニケーションもサポートします。Alexaが話している相手がわかれば、正しい方向に会話を導くことができます。同様に、過去の会話のコンテキストがある場合、Alexaの会話フローを改善し、関連性を高めることができます。
ユーザー固有の情報を提供して親しみを深めるなど、エクスペリエンスをパーソナライズすることにより、スキル使用の満足度が高まります。開発しているスキルの内容に応じて、個別にパーソナライズの程度を調整できます。会話を進める上では、ある程度ユーザーから情報を収集する必要があります。その際、どのような情報を集めて保存するのか、また個々のセッション終了後にどの情報を破棄するのかを決める必要があります。
Alexaはコンテキストを認識しています。ユーザーはトピックを切り替えて、タスク間を移動します。Alexaがタスク間やデバイス間を円滑に移行できるように、エクスペリエンスをデザインします。
Skill Connectionsを使用すると、Alexaスキルは別のスキルを使用して特定のタスクを実行したり、頻度の高いタスクを外部のプロバイダーに任せることができます。Skill Connectionsによって、ユーザーはスキルが変わっても同じ情報を繰り返すことなく自由にスキル間を移動できるようになるため、Alexaのユーザーエクスペリエンスが向上します。たとえば、レシピスキルを使っているユーザーが、レシピを印刷するために「これを印刷して」と言ったとします。すると、レシピスキルは、Skill Connectionsを使って印刷スキルにリクエストを転送できます。
詳細については、以下を参照してください。
ユーザーのニーズをスキルで処理するのが最適な場合と、処理を別のスキルに移行した方がよい場合については、こちら(英語)をご覧ください。
Alexa Skills Kitは、これらの原則を実践するAlexa-hostedスキルテンプレートを提供します。クイックスタートテンプレートからカスタムスキルを作成する方法の詳細については、ドキュメントを参照してください。