あなたのAlexaコンソール
?
サポート

機能設計ガイド

AVS製品の機能要件

Amazon Alexaが使えるデバイスを購入するユーザーは、使いやすいエクスペリエンスを期待しています。このドキュメントでは、Alexaを搭載するデバイスの開発、プロトタイピング、商用リリースの準備において、ユーザーの期待に応えて問題を回避できるよう、機能とデザインの要件と推奨事項について説明します。

共通の用語

このドキュメント全体で、要件と推奨事項を示すには以下の用語を一貫して使用します。

  • しなければならない: 「しなければならない」が使われている項目は、すべての商用デバイスに必須であることを示します。
  • することが推奨される: 「することが推奨される」が使われている項目は、すべての商用デバイスに対して推奨されており、Alexaのユーザーエクスペリエンスが大きく向上することを示します。

このドキュメント全体で、Alexaの機能やコンセプトを示すには以下の用語を一貫して使用します。

  • 音声起動: ユーザーの発話によってハンズフリーで起動される製品。タッチによって起動することも可能です。
  • タッチ起動: ユーザーの製品への物理的なアクションによって起動される製品。これらの製品は、音声起動の対話をサポートしていません。
  • Tap-to-talk (タップトゥートーク): ユーザーが話しかける前にボタンを押して離すことにより起動するタッチ起動の製品。
  • Hold-to-talk (ホールドトゥートーク): ユーザーが話している間ボタンを押したままにして起動するタッチ起動の製品。
  • アテンション状態: Alexaの対話フローを構成する状態。ListeningやThinkingなどが含まれます。
  • 物理コントロール: Alexaの起動や製品の設定調整に使用されるハードウェアまたはGUIのコントロール。
  • ビジュアルキュー: ユーザーにAlexaの状態に関するフィードバックを提供するLEDまたはGUIの要素。
  • オーディオキュー: ユーザーにAlexaのアテンション状態の遷移に関するフィードバックを提供するサウンド。
  • マルチターン: マルチターンの対話とは、対話を完了させるためにAlexaがユーザーに対して追加の音声情報をリクエストする状況を指します。マルチターンの状況は、製品がAVSからExpectSpeechディレクティブを受け取ったときに開始されます。

継続的に更新されるドキュメント

Amazonでは、AVSコミュニティによってAlexaがより使いやすくなり、まったく新しいエクスペリエンスが生み出されることを期待しています。開発者の皆様からのフィードバックからヒントを得て新たな機能を展開するごとに、このドキュメントにも改良や更新を加えていく予定です。

現行のガイドラインは、2017年6月26日に公開されたものです。

1. コアの要件と推奨事項

以下の要件と推奨事項は、Alexaに対応するすべての製品に適用されます。

1.1. 製品は、SpeechRecognizerインターフェースに指定された仕様に従い、オーディオ入力(1つ以上のマイクを使ったユーザー音声のキャプチャなど)と、キャプチャした音声のクラウドへのストリーミングに対応していなければならない。

1.2. 製品は、オーディオ出力(スピーカー、ヘッドフォン、ライン出力、Bluetoothなど)に対応していなければならない。

1.2.1 製品は、音量調節が可能な物理コントロールを搭載することが推奨される。

1.3. 製品は、Alexaとの対話を手動で開始する物理コントロールを提供しなければならない。

1.3.1. 製品は、Alexaが開始した出力(メディアの再生やAlexaの音声による応答)を、ユーザーが音声や物理コントロールによって割り込めるようにしなければならない。1.3を満たす物理コントロールをAlexaが開始した出力への割り込みに使用できるようにしなければならない。

1.3.2. 1.3を満たすGUIコントロールを実装するよう選択した場合、それらのGUIコントロールはユーザーインターフェースから常にアクセスでき、どのような場合にも非表示にできないようにしなければならない。

1.3.4. 物理コントロールは、Alexaとの対話を開始するという1つの目的にのみ使用することが推奨される。

1.4. 製品は、Alexaのアテンション状態をはっきりとユーザーに伝えなければならない。主要なアテンション状態は、Listening、Thinking、Speakingです。Alexaのアテンション状態に関する詳細は、AVS UX設計ガイドラインを参照してください。

1.4.1. 製品は、1.4を満たすため、よく目立つビジュアルキューを使用することが推奨される。製品がビジュアルキューを使用する場合、AVS UX設計ガイドラインに定められたすべてのアテンション状態を示すことが推奨される。

1.4.2. 製品が、1.4を満たしたよく目立つビジュアルキューを使用しない場合、AlexaがListening状態を開始および終了したことを示す、わかりやすいオーディオキューを使用しなければならない。ユーザーがそのオーディオキューを無効にできるかどうかは任意です。

1.4.3. 製品が、1.4を満たすためにビジュアルキューとオーディオキューをどちらも使用する場合、AlexaがListening状態を開始および終了したことを示すビジュアルキューとオーディオキューは同期しなければならない。

1.5. 製品は、Alexaとのマルチターンの対話をサポートしなければならない。

1.5.1. 製品は、すべてのマルチターンの対話において、対話の開始時と同じ方法でAlexaのListening状態の開始と終了をユーザーに伝えなければならない。

1.6. 製品は、インターネット接続が利用できないときのアラートの消音、音量調節、メディア再生の停止をサポートしなければならない。

2. 音声起動の製品

以下のガイドラインは、音声起動の製品に固有であり、これらの製品に関するコアの要件と推奨事項を拡張するものです。

2.1. 製品は、承認されたAmazon Alexaのウェイクワード(“Alexa”など)のみを使用しなければならない。

2.2. 製品は、マルチターンの対話においてウェイクワードを待つことなくマイクを自動的にオンにしなければならない。1.5も参照してください。

2.3. 製品は、常時マイクを無効にすることが可能なコントロールを搭載しなければならない。また、ビジュアルキューを使用してAlexaがマイクオフのアテンション状態であることを常にはっきりユーザーに伝えなければならない。

2.3.1. 製品は、マイクオフのアテンション状態のアクティブ/非アクティブを示すオーディオキューを提供しなければならない。

2.4. 製品は、インターネット接続が利用できないときにマイクの有効化/無効化をサポートしなければならない。1.6も参照してください。

2.5. 製品は、クラウドベースのウェイクワード検証をサポートしなければならない。

3. タッチ起動の製品

以下のガイドラインは、タッチ起動の製品に固有であり、これらの製品に関するコアの要件と推奨事項を拡張するものです。記載がない限り、ガイドラインはTap-to-talk、Hold-to-talkのどちらの製品にも適用されます。

3.1. 製品はユーザー発話にウェイクワードの使用を必須にしてはならない。

3.2. 製品のマイクは、ユーザーがAlexaとの対話を開始するまでは無効でなければならない。

3.3. 製品は、マルチターンの状況においてタッチ操作を待つことなくマイクを自動的にオンにしなければならない。唯一の例外は、ユーザーが物理コントロールを押している間のみマイクがオンになるHold-to-talkデバイスです。1.5も参照してください。

3.4. 製品は、Listeningアテンション状態の開始と終了を示すため、オーディオキューを使用しなければならない。

4. メディアサービス

以下のガイドラインは、Amazon Music、TuneIn、iHeartRadio、Audible、フラッシュブリーフィングなどのメディアサービスをサポートするすべての製品に適用されます。競合するオーディオ出力の処理に関するその他の情報は、Alexa Voice Serviceの対話モデルを参照してください。以下のガイドラインは、すべて音声起動製品、タッチ起動製品の両方に適用されます。

4.1. 製品は、メディア再生中にユーザーがAlexaとの対話を開始したときに、オーディオ出力を一時停止するか音量を小さく(スピーカーの音量を下げる)しなければならない。

4.1.1. 製品は、ユーザーからの割り込みが入ったときにAudibleコンテンツの再生を一時停止しなければならない。

4.1.2. 製品は、ユーザーの割り込みによってメディアを一時停止した場合、自動で再生を再開することが推奨される。

4.2. 製品は、ユーザーに音声リクエストや物理コントロールを使用してメディアを一時停止することを許可しなければならない。

4.3. 製品は、インターネット接続が短時間不通になってもメディア再生が中断しないよう、十分なバッファリングを行うことが推奨される。

5. アラート

以下のガイドラインは、タイマーやアラームなどのアラートの配信と操作に適用され、1.6に記載されたコアの要件と推奨事項を拡張するものです。

5.1. 製品は、インターネット接続が利用できないとき、設定済みのアラートをユーザーに配信しなければならない。

5.1.1 インターネット接続が利用できない間にアラートを配信した場合、製品は、インターネット接続が再確立したときに、配信したアラートについての適切なイベントをAlexaに送信しなければならない。その他の情報については、Alertsの概要を参照してください。

5.2. 製品は、鳴動しているアラートを停止するための物理コントロールをサポートすることが推奨される。

5.3. 製品は、アラート用に独立した音量調節をサポートすることが推奨される。ユーザーがメディア出力の音量を調節したとき、アラートの音量には影響しないようにすることが推奨される。

6. 通知

以下のガイドラインは、通知の配信と操作に適用されます。

6.1. 製品は、Notificationディレクティブのペイロードで指定されたオーディオアセットをダウンロードして使用しなければならない。

6.1.1. ダウンロードが失敗またはタイムアウトした場合、製品はAmazonにより提供された通知サウンドを使用しなければならない。

6.2. 製品は、アテンションシステムのガイダンスに従って、視覚的な通知インジケーターを実装することが推奨される。

7. 表示カード

以下のガイドラインは、画面を持つ製品に固有のものであり、音声起動の製品、タッチ起動の製品の両方に適用されます。表示カードについての詳細は、AVS UX設計ガイドラインTemplateRuntimeインターフェースを参照してください。

7.1. 製品は、画面サイズの仕様に合わせてすべてのビジュアルメタデータをレンダリングしなければならない。また、ユーザーに表示するとき、メタデータへの追加、削除、変更をどのようなものであっても行ってはならない。

7.1.1. 製品でメディアが有効な場合、提供されるすべての再生コントロールを表示しなければならない。

7.2. 製品は、提供される表示カードの設計ガイドラインに準拠することが推奨される。

8. セットアップと認証

AlexaのセットアッププロセスはAlexaの価値をユーザーに伝え、製品をAmazonアカウントに接続できるようにします。Alexaセットアップフローは、製品のセットアップまたは最初に起動する際のエクスペリエンスに組み込むのが理想的です。Alexaのセットアップと認証エクスペリエンスに関するブランディングとスタイルの詳細は、AVS UX設計ガイドラインを参照してください。

8.1. 製品は、ユーザーの認証にLogin With Amazon (LWA)を使用しなければならない。その他の情報については、Alexa Voice Service APIの概要の「認可」セクションを参照してください。

8.2. 製品は、AVS UX設計ガイドラインに記載されたセットアップと認証のガイドラインに準拠した、Alexaセットアップとサインインのエクスペリエンスを提供しなければならない。

8.2.1. 製品は、ユーザーがLogin With Amazon認証フローに入る前にスプラッシュ画面を表示しなければならない。スプラッシュ画面には、AVS UXのセットアップと認証ガイドラインに定められた必須要素を含めなければならない。

8.2.2. 製品は、ユーザーがLogin With Amazon認証フローを終了した後に「使い方の例」画面を表示しなければならない。「使い方の例」画面には、AVS UXのセットアップと認証ガイドラインに定められた必須要素を含めなければならない。

8.3. 製品は、ユーザーのログアウトをサポートしなければならない。

8.4. 製品の説明書に、Alexaのセットアップと使用方法に関する情報を含めることが推奨される。

9. Bluetooth

これらの要件は、Bluetoothインターフェースを使用する製品に固有のものです。

9.1. 製品は、BluetoothのAdvanced Audio Distribution Profile (A2DP)プロファイルをサポートすることが推奨される。

製品がA2DPをサポートする場合、A2DPソースデバイスからのオーディオデジタルストリームの受信をサポートしなければならない。

製品がA2DPをサポートする場合、BluetoothのAudio/Video Remote Control Profile (AVRCP)をサポートしなければならない。

9.2. 製品がBluetoothインターフェースを使用する場合、Amazonによって提供されるBluetoothサウンドを使用しなければならない。

リソース