アプリおよびコンテンツの音声対応について


アプリおよびコンテンツの音声対応について

Fire TV Cube(日本未対応)のリリースにより、ユーザーはハンズフリー(「遠隔制御」と呼ばれます)でTVを操作できるようになります。ユーザーは、Fire TVでコンテンツの再生、コンテンツの検索、再生の制御、チャンネルの変更をAlexaに音声で依頼できます。Fire TV Cube(日本未対応)がない場合でも、ユーザーがAlexa対応デバイス(EchoやEcho Dotなど)をFire TVとリンクさせると、同様のハンズフリー方式でコンテンツの操作や再生の制御を行うことができます。また、Alexa対応音声認識リモコンの音声ボタンを使用することでTVを操作することもできます。

Fire TVで音声操作をサポートするにあたり、アプリの音声対応化がますます重要になっています。アプリの音声対応化技術には、 ビデオスキルAPIMedia Session APIアプリ内の音声スクロールと選択があります。

重要な用語

Alexaの統合により、聞き慣れない用語が新たに増えてきます。次の用語集では、これらの用語の定義について説明します。

ビデオスキル

Fire TVアプリ対応のAlexaビデオスキルを構築すると、ユーザーは自然言語のコマンドを使用して、アプリのコンテンツの検索、アプリの起動、メディア再生の制御、チャネルの変更などができるようになります。ビデオスキルの実装には、AlexaからのディレクティブをサポートするLambdaの構築、Alexa Client Libraryの統合、ADMによるクラウドからアプリへの通信の処理などが含まれます。Fire TV対応アプリにビデオスキルを実装するには、カタログ統合が必須となります。はじめに、Fire TV対応アプリ用ビデオスキルについてを参照してください。

Fire TV対応アプリにビデオスキルを統合することで、以下の機能が利用可能になります。

  • アプリの起動: ユーザーが特定のコンテンツの再生や検索を依頼すると、Alexaが自動的に適切なFire TV対応アプリを起動します。「アレクサ、<アプリ名>を開いて」と言うと、アプリのホームページに移動します。ビデオスキルを使用すると、AlexaビデオスキルAPI経由でアプリを自動的に起動できるようになります。
  • クイック再生: 「アレクサ、<番組名>を再生して」または「アレクサ、<アプリ名>で<番組名>を再生して」と言うだけで、ビデオを再生することができます。その際、該当コンテンツを含む適切なアプリが開き、Fire TVが自動的に再生を開始します(詳細ページへは移動しません)。
  • 検索: 「アレクサ、<番組名>を探して」と言えば、Alexaにコンテンツのユニバーサル検索を依頼できます。 「ユニバーサル検索」では、カタログ統合されているすべてのFire TV対応アプリを対象にコンテンツ検索が行われます。検索範囲を特定のアプリに絞る方法は「ローカル検索」と呼ばれ、 「アレクサ、<アプリ名>で<番組名>を探して」や「アレクサ、<アプリ名>で<ジャンル>を探して」などと言うことで実行することができます。
  • トランスポートコントロール: 「アレクサ、早送りして」「アレクサ、5分早送りして」「アレクサ、次へ」「アレクサ、前へ」などの発話を使用すると、再生・早戻し・一時停止・再開・停止などの操作を音声で制御することができます。
  • チャンネル変更: ライブ配信機能を搭載するアプリの場合、「アレクサ、<アプリ名>に変えて」などの発話を通じてチャネルを切り替えることができます。

Fire TVアプリにビデオスキルを統合することで、ユーザーがコンテンツを簡単に見つけて再生できるようになります。

Media Session API

ビデオスキルを実装するのに必要な帯域幅やリソースがない場合や、計画された実装が数か月先である場合は、Media Session APIを使用して、アプリのメディア再生コントロールを音声対応化することができます。Media Sessionは、ストリーミングアプリがメディアコマンドを受け取れるようにするAndroid APIです。これは、リモコン、Bluetooth、adb、Fire TVコンパニオンアプリなどからのイベントを処理する際に推奨されるベストプラクティスです。

Media Sessionを統合することで、ユーザーはメディア再生で「再生」「一時停止」「巻き戻し」などの音声コマンドを使用できるようになります。これらのコマンドは、近距離デバイスと遠距離デバイスの両方で機能します。Media Sessionでは、ビデオスキルAPIで説明されているような、アプリの起動やコンテンツの検索といった高度な音声制御は実行できません。Media Sessionを組み込むと、再生コントロールを音声対応化できるだけです。

(ほとんどの開発者のように)既にMedia Sessionを実装済みであれば、Media Sessionを音声対応化するのに必要な作業はほぼありません。アプリのマニフェストに特別なAlexaパーミッションを追加するだけです。詳細については、 MediaSession APIを使用した音声対応トランスポートコントロールを参照してください。

Media Sessionの使用が初めてで、アプリにまだ統合していない場合は、次のチュートリアルを参照してください。 Implementing Voice Control with the Media Session API on Amazon Fire TV

アプリ内の音声スクロールと選択

Fire TV Cube(日本未対応)では、ユーザーがAlexaの一般的な発話を使用してスクロールと選択を実行できます。アプリ内の音声スクロールと選択に関する機能は、D-Padナビゲーションイベントを音声コマンドにマッピングすることで動作します。D-Padは、上下左右にスクロールするのに使用する、リモコンの方向キーパッドを指します。音声コマンドは、Alexaによってアプリに送信されるD-Padナビゲーションイベントに変換されます。

Amazonは、アプリで音声コマンドがサポートされることを確認した後に、アプリのバックエンドでアプリ内の音声スクロールと選択の機能を手動で有効にします。Amazonでは、スクロールと選択を実行できるアプリを段階的に増やしています。詳細については、アプリ内の音声スクロールと選択を参照してください。