あなたのAlexaダッシュボード 設定

機能設計ガイド

AVS製品の機能要件

Amazon Alexaが搭載された製品を購入するユーザーは、使い慣れたエクスペリエンスを期待しています。このドキュメントでは、Alexa搭載製品の開発、プロトタイピング、商用リリース準備においてユーザーの期待に応え、問題を回避できるよう、機能と設計の要件および推奨事項について説明します。

頻出用語

以下の用語は、要件や推奨事項を説明する際に、このドキュメント全体で一貫して使われるものです。

  • **しなければなりません: 「**しなければなりません」と記載されている場合は、商用リリースされるすべての製品に対して「必須」であることを示します。
  • **することが推奨されます: 「**することが推奨されます」と記載されている場合は、商用リリースされるすべての製品に対して「推奨」され、Alexaのユーザーエクスペリエンスを著しく向上させることを示します。

以下の用語は、Alexaの機能や概念を説明する際に、このドキュメント全体で一貫して使われるものです。

  • 音声起動: ユーザーの音声により、ハンズフリーで起動される製品を指します。これらの製品は、ユーザーのタッチ操作により起動することもできます。
  • タッチ起動: 製品への物理的なアクションにより起動される製品を指します。これらの製品は、音声起動の対話をサポートしません。
  • Tap-to-talk: ユーザーが話す前にボタンを押下して離すことにより起動されるタッチ起動の製品を指します。
  • Hold-to-talk: ユーザーが話している間ボタンを押下し続けることにより起動されるタッチ起動の製品を指します。
  • アテンション状態: Alexaの会話フローの要素であり、ListeningやThinkingも含まれます。
  • 物理コントロール: Alexaを起動したり、製品の設定を調整するために使用されるハードウェアまたはGUIのコントロールを指します。
  • ビジュアルキュー: ビジュアルキューとは、ユーザーに対してAlexaの状態をフィードバックするLEDまたはGUIの要素を指します。
  • オーディオキュー: オーディオキューとは、ユーザーに対してAlexaのアテンション状態間の遷移をフィードバックする音声を指します。
  • マルチターン: マルチターン対話は、Alexaが対話を完了するためにユーザーに対して追加の音声情報をリクエストする状況のことを指します。マルチターンの状況は、製品がAVSからのExpectSpeechディレクティブを受信したときに開始されます。

随時更新されるドキュメント

Amazonでは、AVSコミュニティにより、Alexa対応のエクスペリエンスが刷新され、新たに追加されることを見込んでいます。皆様からのフィードバックをもとに、新たな機能を導入した場合は、このドキュメントも改訂され更新される予定です。

現在のガイドラインは、2017年6月26日に公開されたものです。

1.コア要件および推奨事項

以下の要件および推奨事項は、すべてのAlexa搭載製品に適用されます。

1.1.製品は、SpeechRecognizerインターフェースで提供される仕様に従って、オーディオ入力(1つ以上のマイクからのユーザー音声のキャプチャなど)およびキャプチャした音声をクラウドにストリーミングすることができなければなりません

1.2.製品は、オーディオ出力(スピーカー、ヘッドフォン、ライン出力、Bluetoothなど)ができなければなりません

1.2.1 製品は、音量調整のための物理コントロールを提供**することが推奨されます**。

1.3.製品は、Alexaとの対話を手動で開始するための物理コントロールを提供しなければなりません

1.3.1.製品では、ユーザーが音声や物理コントロールを使用して、Alexaが開始した出力(メディア再生やAlexa音声による応答など)を中断できるようにし**なければなりません**。1.3を満たす物理コントロールも、Alexaが開始した出力を中断するのに使用でき**なければなりません**。

1.3.2.1.3を満たすのにGUIコントロールの実装を選択した場合は、ユーザーインターフェースから常にアクセス可能で、どんな場合にも非表示にできないようにし**なければなりません**。

1.3.4.物理コントロールは、Alexaとの対話を開始するという1つの目的のみを持つ**ことが推奨されます**。

1.4.製品は、ユーザーに対して、Alexaのコアのアテンション状態を明確に伝えなければなりません。コアのアテンション状態とは、「聞き取り中」、「考え中」、「発話中」です。Alexaのアテンション状態の詳細については、AVS UX設計ガイドラインを参照してください。

1.4.1.製品は、1.4を満たすために、わかりやすいビジュアルキューを使用することが推奨されます。製品がビジュアルキューを使用する場合、製品はAVS UX設計ガイドラインに定義されたすべてのアテンション状態を示すことが推奨されます

1.4.2.製品が1.4を満たすためにわかりやすいビジュアルキューを使用しない場合、製品はAlexaがいつ「聞き取り中」状態を開始し、いつ停止したかを示す、わかりやすい音声キューを使用し**なければなりません**。ユーザーが音声を無効化できるようにすることもできます。

1.4.3.製品が1.4を満たすためにわかりやすいビジュアルキューおよび音声キューの両方を使用する場合、ビジュアルキューおよび音声キューはAlexaがいつListening状態を開始し、いつ停止したかを示す際に同期されなければなりません

1.5.製品は、Alexaとのマルチターン対話をサポートしなければなりません

1.5.1.製品は、最初の対話と同じ方法を使用して、すべてのマルチターン対話について、Listeningのアテンション状態の開始と終了を示さ**なければなりません**。

1.6.製品は、アラートの音声の無効化、音量調整、インターネット接続を利用できない場合のメディアの停止をサポートしなければなりません

2.音声起動の製品

以下は、音声起動の製品に固有のガイドラインであり、それらの製品のコア要件と推奨事項を拡張するものです。

2.1.製品は、ウェイクワードとして「Alexa」のみを使用しなければなりません

2.2.製品は、マルチターン対話においてウェイクワードを待つことなく、自動的にマイクを有効化しなければなりません1.5も参照してください。

2.3.製品は、マイクを無効にする常に利用可能なコントロールを提供しなければなりません。また、ビジュアルキューを使用して、Alexaの「マイクオフ」アテンション状態がアクティブであることをユーザーに対して明確にかつ連続して伝えなければなりません

2.3.1.製品では、「マイクオフ」アテンション状態がアクティブ化および非アクティブ化されたときにオーディオキューを提供し**なければなりません**。

2.4.製品は、インターネット接続が利用できない場合のマイクの有効化/無効化をサポートしなければなりません1.6も参照してください。

3.タッチ起動の製品

以下は、タッチ起動の製品に固有のガイドラインであり、それらの製品のコア要件と推奨事項を拡張するものです。特に記載のない場合、これらのガイドラインはTap-to-talkおよびHold-to-talkの製品の両方に適用されます。

3.1.製品は、ユーザー発話の一部としてのウェイクワードの使用を必須としてはいけません

3.2.製品のマイクは、ユーザーがAlexaとの対話を開始するまで無効にしておかなければなりません

3.3.製品は、マルチターンの状況においてタッチ操作を待つことなく、自動的にマイクを有効化しなければなりません。唯一の例外は、ユーザーが物理コントロールを押下し続けている間のみマイクがアクティブ化されるHold-to-talkデバイスです。1.5も参照してください。

3.4.製品は、「聞き取り中」アテンション状態の開始および終了を示すためにオーディオキューを使用しなければなりません

4.メディアサービス

以下は、Amazon Music、TuneIn、iHeartRadio、Audible、フラッシュブリーフィングといったメディアサービスをサポートするすべての製品に適用されるガイドラインです。競合するオーディオ出力の処理に関するその他の情報は、Alexa Voice Serviceの対話モデルを参照してください。後述のガイドラインはすべて、音声起動、タッチ起動の両方の製品に適用されます。

4.1.製品は、メディア再生中にユーザーがAlexaとの対話を開始したときに、オーディオ出力を一時停止または減衰(スピーカーの音量を下げる)しなければなりません

4.1.1.製品は、ユーザーによる割り込みがあったときにAudibleコンテンツの再生を一時停止し**なければなりません**。

4.1.2.ユーザーの割り込みによってメディアを一時停止した場合、自動的に再開**することが推奨されます**。

4.2.製品では、ユーザーが音声リクエストまたは物理コントロールを使用して一時停止したメディアを再開できるようにしなければなりません

4.3.製品は、インターネット接続中の短い中断の場合に再生が途中で停止しないよう、メディアを十分にバッファリングすることが推奨されます

5.Alerts

以下は、タイマーやアラームといったアラートの配信と制御に適用され、1.6のコア要件および推奨事項を拡張するものです。

5.1.製品は、インターネット接続が利用できないときでも、事前に予定されていたアラートをユーザーに配信しなければなりません

5.1.1 インターネット接続が利用できない間にアラートを配信した場合、製品は、インターネット接続が再確立されたときに、配信されたアラートの適切なイベントをAlexaに送信しなければなりません。その他の情報については、Alertsの概要を参照してください。

5.2.製品は、鳴っているアラートを停止する物理コントロールをサポートすることが推奨されます

5.3.製品は、アラート用に独立した音量コントロールをサポートすることが推奨されます。ユーザーがメディア出力の音量を調整したとき、アラートの音量に影響しないようにすることが推奨されます

6.通知

以下は、通知の配信と制御に適用されるガイドラインです。

6.1.製品は、通知ディレクティブのペイロードで指定されたオーディオアセットをダウンロードして使用しなければなりません

6.1.1.ダウンロードに失敗したか、タイムアウトした場合、製品は、Amazonで提供される通知音を使用しなければなりません

6.2.製品は、AVS UX設計の概要に定義されたビジュアル通知インジケーターパターンを実装することが推奨されます

7.表示カード

以下のガイドラインは画面ベースの製品に固有の内容であり、音声起動、タッチ起動の両方の製品に適用されます。表示カードの詳細については、AVS UX設計ガイドラインおよびTemplateRuntimeインターフェースを参照してください。

7.1.製品は、画面サイズの仕様に従ってすべてのビジュアルメタデータをレンダリングしなければなりません。また、ユーザーへの表示時にメタデータの追加、削除、変更を決して行ってはなりません

7.1.1.メディアが有効な場合、製品はすべての再生コントロールを表示しなければなりません

7.2.製品は、提供された表示カード設計ガイドラインに従うことが推奨されます

8.セットアップと認証

AlexaのセットアッププロセスはAlexaの値を伝え、ユーザーが自身のAmazonアカウントに製品を接続できるようにします。理想的には、Alexaセットアップフローは製品のセットアップまたは最初の実行時に組み込まれることが推奨されます。Alexaのセットアップと認証のエクスペリエンスに関するブランディングおよびスタイル情報の詳細については、AVS UX設計ガイドラインを参照してください。

8.1.製品は、ユーザーの認証のためにLogin With Amazon(LWA)を使用しなければなりません。その他の情報については、Alexa Voice Service APIの概要の「認証」セクションを参照してください。

8.2.製品は、AVS UX設計ガイドラインのセットアップと認証のガイドラインに準拠したAlexaセットアップ/サインインエクスペリエンスを持たなければなりません

8.2.1.製品は、ユーザーがLWA認証フローに入る前のスプラッシュ画面を用意しなければなりません。スプラッシュ画面には、AVS UX設計ガイドラインに定められた必須の要素を含めなければなりません

8.2.2.製品は、ユーザーがLWA認証フローを出た後の「使い方の例」画面を用意しなければなりません。「使い方の例」画面には、AVS UX設計ガイドラインに定められた必須の要素を含めなければなりません

8.3.製品は、ユーザーによるログアウトをサポートしなければなりません

8.4.製品の取扱説明書には、Alexaのセットアップと使用に関する情報を含めることが推奨されます

9.Bluetooth

以下の要件は、Bluetoothインターフェースを使用する製品に固有の内容です。

9.1.製品は、Advanced Audio Distribution Profile(A2DP)Bluetoothプロファイルをサポートすることが推奨されます

製品がA2DPをサポートする場合、A2DP SOURCEデバイスからのデジタルオーディオストリームの受信をサポートしなければなりません

製品がA2DPをサポートする場合、Audio/Video Remote Control Profile(AVRCP)Bluetoothプロファイルをサポートしなければなりません

9.2.製品がBluetoothインターフェースを使用する場合、Amazonが提供するBluetoothサウンドを使用しなければなりません

リソース