アプリおよびコンテンツの音声対応について


アプリおよびコンテンツの音声対応について

Fire TV Cube(日本未対応)のリリースにより、ユーザーはハンズフリー(「遠隔制御」と呼ばれます)でTVを操作できるようになります。ユーザーは、Fire TVでコンテンツの再生、コンテンツの検索、再生の制御、チャンネルの変更をAlexaに音声で依頼できます。Fire TV Cube(日本未対応)がない場合でも、ユーザーがAlexa対応デバイス(EchoやEcho Dotなど)をFire TVとリンクさせると、同様のハンズフリー方式でコンテンツの操作や再生の制御を行うことができます。また、Alexa対応音声認識リモコンの音声ボタンを使用することでTVを操作することもできます。

Fire TVで音声操作をサポートするにあたり、アプリの音声対応化がますます重要になっています。アプリの音声対応化技術には、 ビデオスキルAPIMedia Session APIアプリ内の音声スクロールと選択があります。

重要な用語

Alexaの統合により、聞き慣れない用語が新たに増えてきます。次の用語集では、これらの用語の定義について説明します。

ビデオスキルAPI

ビデオスキルAPIは、アプリやそのコンテンツとFire TVを密接に統合します。ビデオスキルAPIには以下の機能が備わっています。

  • アプリの起動: ユーザーが特定のコンテンツの再生や検索を依頼すると、Alexaが自動的に適切なFire TVアプリを起動します。ユーザーが「アレクサ、<アプリ名>を開いて」と言うと、アプリのホームページに移動します。ビデオスキルAPIを使うと、Alexaビデオスキルから自動的にアプリを起動できます。
  • クイック再生: ユーザーは、Alexaに「アレクサ、<番組名>を再生して」または「アレクサ、<アプリ名><番組名>を再生して」と言うことでビデオを再生できます。Alexaは、そのコンテンツを含む適切なアプリにユーザーをルーティングし、Fire TVが(詳細ページに移動するのではなく)自動的に再生を開始します。
  • 検索: ユーザーは、Alexaに「アレクサ、<番組名>を見せて」と言うことでコンテンツを検索できます。 範囲がアプリに限定されていない検索は「ユニバーサル検索」と呼ばれ、カタログに統合されているあらゆるFire TVアプリのコンテンツを検索します。ユーザーは、「アレクサ、<アプリ名><番組名>を見せて」または「アレクサ、<アプリ名>でドラマを見せて」と言うことで、検索範囲をアプリに限定できます。 アプリを含む検索は「ローカル検索」と呼ばれます。 ユーザーが使用するアプリを指定した場合は、Fire TVからそのアプリ内の検索機能に移行します。
  • 配信コントロール: ユーザーは、「アレクサ、早送りして」、「アレクサ、5分早送りして」、「アレクサ、次」、「アレクサ、前」などの呼びかけを使用して、再生、巻き戻し、一時停止、再開、停止などの操作を音声で制御できます。
  • チャンネル変更: アプリがライブTV機能を提供している場合、ユーザーは「アレクサ、<アプリ名>に合わせて」などと呼びかけるだけでチャンネルを切り替えることができます。

ビデオスキルAPIを実装することで、ユーザーは簡単にコンテンツを探せるようになるため、カスタマーエクスペリエンスが向上します。ユーザーがより簡単にコンテンツを検索して再生できるようになるため、より多くのコンテンツを視聴してもらうことができます。

コンテンツがFire TVで全世界に公開されている場合でも、再生するコンテンツや検索結果に表示するコンテンツは制御できます。

ビデオスキルAPIには以下の機能が備わっています。

資料は更新中であるため、オンラインで開放された場所にではなく、パスワードで保護された空間にある場合があります。ソリューションアーキテクトは、ビデオスキルAPIが適切かどうか評価できます。適切な場合は、資料とサンプルコードへのアクセス権が付与されます。

ビデオスキルAPIの統合には、ビデオオンデマンドコンテンツをAmazonカタログに統合するのに必要な時間に加えて、開発作業に約1か月、認定に数週間かかります。Fire TVとのビデオスキルAPIの統合の条件を満たしているかどうかについては、Amazonにお問い合わせください

Echo Showでビデオを見られるようにする方法の詳細については、Understand Video Skill Integration for Echo Show(英語のみ)を参照してください。

Media Session API

ビデオスキルAPIを実装するのに必要な帯域幅やリソースがない場合や、計画された実装が数か月先である場合は、Media Session APIを使用して、アプリのメディア再生コントロールを音声対応化することができます。Media Sessionは、ストリーミングアプリがメディアコマンドを受け取れるようにするAndroid APIです。これは、リモコン、Bluetooth、adb、Fire TVコンパニオンアプリなどからのイベントを処理する際に推奨されるベストプラクティスです。

Media Sessionを統合することで、ユーザーはメディア再生で「再生」「一時停止」「巻き戻し」などの音声コマンドを使用できるようになります。これらのコマンドは、近距離デバイスと遠距離デバイスの両方で機能します。Media Sessionでは、ビデオスキルAPIで説明されているような、アプリの起動やコンテンツの検索といった高度な音声制御は実行できません。Media Sessionを組み込むと、再生コントロールを音声対応化できるだけです。

(ほとんどの開発者のように)既にMedia Sessionを実装済みであれば、Media Sessionを音声対応化するのに必要な作業はほぼありません。アプリのマニフェストに特別なAlexaパーミッションを追加するだけです。詳細については、こちらをご覧ください。 Android Media Session APIで音声対応の配信コントロールを実装する

Media Sessionの使用が初めてで、アプリにまだ統合していない場合は、次のチュートリアルを参照してください。 Implementing Voice Control with the Media Session API on Amazon Fire TV

アプリ内の音声スクロールと選択

Fire TV Cube(日本未対応)では、ユーザーがAlexaの一般的な発話を使ってスクロールと選択を実行できます。アプリ内の音声スクロールと選択に関する機能は、D-Padナビゲーションイベントを音声コマンドにマッピングすることで動作します。D-Padは、上下左右にスクロールするのに使用する、リモコンの方向キーパッドを指します。音声コマンドは、Alexaによってアプリに送信されるD-Padナビゲーションイベントに変換されます。

Amazonは、アプリで音声コマンドがサポートされることを確認した後に、アプリのバックエンドでアプリ内の音声スクロールと選択の機能を手動で有効にします。Amazonでは、スクロールと選択を実行できるアプリを段階的に増やしています。詳細については、アプリ内の音声スクロールと選択を参照してください。