開発者コンソール

Echo Show用VSKについて


Echo Show用VSKについて

Echo Showデバイスでは、話しかけたり画面にタッチしたりして、さまざまなエクスペリエンスを楽しむことができます。Echo Show用に設計されたビデオスキルでは、ビデオコンテンツと音声操作(複数のモード)を組み合わせることができます。Echo Showはアプリレスのデバイスですが、VSK(Video Skills Kit)を実装すると、ビデオコンテンツを配信することができ、Echo Showユーザーが画面タッチや音声コマンドでビデオを制御できるようになります。

Echo Showデバイス

Echo Showは「常にオン」のアプリレスデバイスであり、クラウドベースのスキルと汎用のオンデバイスコンポーネントを活用します。

Echo Showでビデオスキルを使用する一般的なシナリオとしては、キッチンで料理をしているユーザーが、「アレクサ、『ボッシュ』を再生して」と話しかけるシーンなどが考えられます。

マルチモーダルデバイスの使用例
Echo ShowへのVSKの使用例

Amazonでは、以下のEcho Showデバイスを提供しています。

2018年10月に発売されたEcho Show(第2世代)は、10.1インチのHD画面を搭載しています。2019年6月に発売されたEcho Show 5は、よりコンパクトな5.5インチ画面を備えています。2019年11月に発売されたEcho Show 8は、8.0インチの画面を搭載しています。現在、Echo SpotはVSK統合をサポートしていません。

VSK(Video Skills Kit)

VSK(Video Skills Kit)は、ユーザーがAlexaを使用してビデオコンテンツを操作できるようにするためのAPIセットです。VSKを使用すると、ビデオコンテンツの操作をサポートするメカニズムを新たに設計しなくても、ビデオスキルを開発できます。従来のカスタムスキル開発では、発話フローや制御フローを設計する必要がありますが、VSKには、Echo ShowやFire TVでビデオ制御メカニズムをサポートするための専用ツールセットが用意されています。

VSKでは、次のようなさまざまな機能を公開しています。

  • 再生制御
  • カタログ検索
  • チャンネル切り替え

ビデオスキルと画面表示を使用するカスタムスキルとの比較

ビデオスキルAPIは、ビデオプロバイダーや、音声対話型デバイスを開発するデバイスメーカーを対象にしています。ビデオスキルの実装では、AWS Lambdaと独自に開発したビデオコンテンツを使用して、「アレクサ、『インターステラー』を再生して」などのAlexaディレクティブを処理する必要があります。

これに対して、Alexaスキルでビジュアル(画像、短いビデオクリップ、プレーンテキストなど)をサポートするには、Alexa Presentation Language(APL)を使用して、Displayテンプレートから(ビデオスキルではなく)カスタムスキルを作成する必要があります。たとえば、ビデオスキルAPIを利用してビデオコンテンツのより複雑な対話型音声操作を提供するのではなく、クイズスキルに関連するテキストや画像をEcho Showの画面に表示するとしましょう。そのような場合は、画面付きのAlexa搭載デバイス用のスキルの作成を参照してください。

Echo Showでのビデオコンテンツの配信

ビデオスキルでは、AWS Lambdaとウェブアプリプレーヤーを使用します。Lambdaの要件はAlexa Skillsアーキテクチャに基づいているのに対し、ウェブプレーヤーのアプリレス要件はEcho ShowアーキテクチャのVSKに基づいています。その動作のしくみを大まかに説明すると、次のようになります。

  • ユーザーがアカウントリンクでビデオスキルを認証する(OAuthなどを使用)。
  • Echo ShowのVSKによって、検索や閲覧などの機能を表示するためのテンプレートが提供される。ビデオコンテンツを入力したテンプレートをデバイスがレンダリングする。
  • 開発者が管理するカスタムウェブプレーヤーでビデオが再生される。

カタログ統合

カタログ統合とは、カタログデータ形式(CDF)というXMLスキーマに従ってメディアを記述し、ドキュメントで説明している手順に沿ってカタログをS3バケットに定期的にアップロードするプロセスのことです。

現在、カタログ統合は長編映画やTV番組シリーズに限定されています。カタログ統合に関するご相談については、Amazonの担当者にお問い合わせください。カタログ統合の条件を満たさない限り、Echo ShowにVSKを完全に実装することはできません。カタログが未統合の場合は、Echo Showデバイス用に独自のビデオスキルを設計する前に、カタログ統合の手順を実行してください。

Echo Show用ビデオスキルのビルド

Echo Showデバイス用の参照ビデオスキルをインストール、ビルド、デプロイするには、次のものが必要です。

  • テスト用のEcho Showデバイス
  • Alexa開発者アカウント
  • AWS開発者アカウント
  • AWS Lambda - 参照ビデオスキルに用意されています。
  • デバイス用に最適化されたウェブプレーヤー - 参照ビデオスキルに用意されています。
  • コンテンツを表示するためのアカウントリンク
  • カタログ統合メディアとカタログ名

また、独自のビデオスキルを作成するには、ロゴ画像と背景画像も必要です。

クイックスタートとして、まず、自動化されたAlexa Video Infrastructure CLIツールを使用して、参照ビデオスキルをインストール、ビルド、デプロイすることを強くお勧めします。このツールを使用すると、コンピューターのターミナルまたはPowerShellでビデオスキルを迅速にセットアップできます。参照ビデオスキルでは、ウェブプレーヤーのほか、デバイスでテストするカタログへのアクセス権限も提供されます。

また、コンテンツのメタデータ取得、カテゴリー検索、複数の検索形式などのバックエンドサービスも実装した方がよいでしょう。

また、Fire TV対応アプリに既にビデオスキルとVSK用Lambda関数を作成してある場合でも、別のビデオスキルと別のVSK用Lambda関数をEcho Showデバイスに新たに作成する必要があります。

ワークフローの概要

Echo Show用のVSKを統合するには、まず、Alexa開発者コンソールでビデオスキルを作成し、そのスキルをAWS Lambda関数に関連付けます。ユーザーが音声でスキルとやり取りすると、Alexa Voice Service(AVS)がユーザーのコマンドを「ディレクティブ」と呼ばれるJSONオブジェクトに変換します。

Alexaは、このディレクティブをLambda関数に送信します。Lambda関数はリクエストを処理し、通常はバックエンドサービスとやり取りし、(検索、クエリなどを実行して)必要な情報を取得します。取得する情報には、リクエストされたコンテンツのURIやリクエストに一致するタイトルなどがあります。Lambda関数は、このような情報を取得してAlexaに返します。

次のステップ

Echo Show用VSKの機能を参照してください。