ビデオスキルとは

ビデオスキルとは

ビデオスキルを構築すると、ユーザーは音声を使用してビデオ体験全体を制御できます。ユーザーは、特定のスキルを呼び出さなくても、ビデオデバイスを制御してビデオコンテンツを利用できます。たとえば、ユーザーは、ビデオデバイスやコンテンツプロバイダーを指定せずに、Alexaに次のようにリクエストできます。

  • ユーザー: アレクサ、スターウォーズ ジェダイの帰還 を再生して

  • ユーザー: アレクサ、ビデオデバイスをオンにして

  • ユーザー: アレクサ、ビデオデバイスの音量を下げて

ビデオスキルとは

ビデオスキルは、ビデオサービスに特化しています。ビデオインターフェースは、次の機能を実行します。

  • コンテンツの検索と再生
  • 一時停止や早戻しなどの再生コントロール
  • 音量の調整
  • ビデオデバイスのオンとオフ
  • ビデオデバイスの入力切換
  • アプリやGUIショートカットの起動
  • ビデオコンテンツの録画
  • チャンネル変更
  • ビデオカタログの取り込み

ビデオスキルは、ビデオ用のカスタムスキルよりも便利です。ビデオインターフェースは、プリビルド音声対話モデルを使用します。このモデルでは、ユーザーがデバイスを制御するために使う定義済みの発話セットが提供されます。これらのインターフェースを介して、Alexaはユーザーが所有しているデバイスや、サブスクリプションを行ったサービスを認識します。これにより、ユーザーはこれらのデバイスやサービスを制御できます。これに対し、カスタムスキルでは、名前でスキルを呼び出す必要があります。これらのカスタムスキルは、ユーザーの幅広いデバイスおよびサービスを認識しません。

たとえば、ビデオプロバイダーがカスタムコンテンツの「サムの冒険」というTVシリーズを制作したとします。 プロバイダーがビデオAPIを使用してAlexaスキルを作成した場合、このコンテンツをAlexaコンテンツカタログに取り込むことができます。するとAlexaはこのコンテンツのプロバイダーを認識します。ユーザーが「アレクサ、『サムの冒険』を再生して」と言うと、Alexaはコンテンツプロバイダーを識別し、適切なスキルを有効にするプロセスにユーザーを誘導します。ビデオAPIがない場合、ユーザーは「サムの冒険」が特定のプロバイダーの提供であること、そのプロバイダーのカスタムスキルを有効にしていることを確認してから、そのスキルに対してコンテンツをリクエストする必要があります。

ビデオスキルのしくみを理解する

Alexaビデオエコシステムは以下で構成されています。

ユーザー
Alexaデバイスと対話する人で、提供されるビデオサービスの加入者のことです。
ビデオスキルAPI
Alexaは、プリビルドの音声コマンドを理解し、音声コマンドをビデオスキルに送信するディレクティブ(JSONメッセージ)に変換します。
AWS Lambda
アマゾン ウェブ サービス(AWS)によって提供される、ビデオスキルコードをホストするコンピューティングサービスです。
ビデオスキル
ディレクティブを解釈し、ビデオアプリやデバイスがユーザーのリクエストを処理できるようにメッセージを送信するコードやコンフィギュレーションです。「ビデオスキル」という用語は、ビデオAPIの統合に含まれるすべてのコンポーネントやサービスを指すために、一般的に使用されます。
ビデオスキルAPI

ビデオAPIはどのような種類のデバイスをサポートしていますか?

次の3種類のデバイスにAlexaビデオスキルを組み込むことができます。

  • リビングルームのエンターテイメントデバイス: リビングルームのエンターテイメントデバイスとは、セットトップボックス、ゲームコンソール、スマートTVのことを指します。これらのデバイスを製造しているメーカーであれば、ビデオスキルをデバイスまたはデバイスクラウドアプリに直接組み込んで、アプリを起動したり、チャンネルを切り替えることができます。ビデオスキルAPIは、ライブテレビとビデオオンデマンドコンテンツにIMDbの公開カタログを使用します。ビデオスキルを実装するには、再生、検索、移動、録画機能をサポートするAWS Lambda関数を構築します。スキルはクラウドからデバイスへの通信を処理します。デバイスソフトウェアはスキルに状態情報を送信します。詳細については、リビングルームデバイス向けビデオスキルを参照してください。

  • Fire TV対応アプリ: Fire TVアプリ向けビデオスキルを使用すると、ユーザーは自然言語のコマンドを使用して、アプリのコンテンツの検索、アプリの起動、メディア再生の制御、チャンネルの切り替えなどができるようになります。たとえば、ビデオスキルを使用すると、ユーザーは「<アプリ名>でボッシュを再生して」や「ボッシュを再生して」などのフレーズを言うことで、アプリにメディアを再生させることができます。Fire TVアプリにビデオスキルを実装するには、最初にAlexaビデオAPIを実装します。ただし、この統合にはAmazon Device Messaging(ADM)、AWS Lambdaなども含まれます。Fire TVアプリ向けビデオスキルを統合することで、ユーザーはコンテンツから最高に豊かな音声エクスペリエンスが得られ、エンゲージメントが高まり、スキルも見つけやすくなります。開発を始めるには、Fire TV対応アプリ用VSKを参照してください。

  • マルチモーダルデバイス: Echo ShowなどのマルチモーダルデバイスはAlexa搭載デバイスと呼ばれ、音声と視覚インターフェースの両方を提供します。マルチモーダルデバイスは「アプリレス」なフレームワークを使用しており、同じAmazonカタログ統合機能を活用することで、既存の再生用HTML5 Webプレイヤーと統合できます。また、ブラウザのレンダリング用テンプレートや、デバイスでの検索機能も提供しています。Fire TVアプリの実装と同様に、マルチモーダルデバイスにビデオスキルを実装するには、Alexaからのリクエストに応答して、その応答をWebプレイヤーに渡すLambda関数を開発します。応答には、リクエストされたメディアを再生するためのコンテンツURIが含まれます。開発を始めるには、Echo Show用VSKを参照してください。

Alexaのビデオスキルを開発できる人

ビデオスキルは誰でも開発できます。ビデオスキルを開発するには、音声発話を解析する必要はありません。解析はAmazonのAlexaサービスが実行します。Alexaサービスでは、ユーザーの音声をどのように解釈すればいいか、ビデオスキルにどのメッセージを送信すればいいかは既に定義されています。

一般的に、ビデオスキル開発は2つのカテゴリーに分けられます。

ビデオスキル開発の前提条件

ビデオスキルを開発するには、以下が必要です。

  • Amazon開発者アカウント
  • クラウドAPIまたはクラウド対応のビデオサービスに接続されたデバイス。
  • Amazon EchoなどのAlexaデバイス。
  • AWSアカウント。スキルコードはAWS Lambda関数としてホスティングします。
  • Java、Node.js、Python、またはC#の知識。これらの言語のいずれかでLambda関数を作成できます。
  • OAuth 2.0についての理解。

サポートされているロケール

ビデオAPIを確認して、ビデオエンドポイントを制御するためにスキルで使用するディレクティブを見つけます。ビデオAPIでサポートされているロケールと言語の詳細については、Alexaインターフェースとサポートしている言語の一覧を参照してください。

ドキュメントガイド

トピック 説明
Fire TVアプリ向けビデオスキル Fire TVアプリ向けビデオスキルの作成を手順を追って説明します。
マルチモーダルデバイス向けビデオスキル Echo Showなどのマルチモーダルデバイス向けビデオスキルの作成を手順を追って説明します。
リビングルームのエンターテイメントデバイス向けビデオスキル セットトップボックス、ゲームコンソール、スマートTVなどのリビングルームのエンターテイメントデバイス向けビデオスキルを手順を追って説明します。
ビデオスキルAPI Alexaビデオスキルに実装するビデオインターフェースです。
機能インターフェースのメッセージガイド Alexaとの間でやり取りするメッセージの構造とパラメーターについて説明します。
ビデオスキルの状態レポート デバイスの状態が変更されたときにAlexaにいつ、どのように変更レポートを送信するかを説明します。
デバイスの検出 Alexaのデバイス検出インターフェースと検出の形式について説明します。
Alexa.ChannelController チャンネル変更のメッセージを説明します。
Alexa.InputController ビデオデバイスの入力変更のメッセージを説明します。
Alexa.PowerController ビデオデバイスの電源状態を制御およびレポートするメッセージを説明します。
Alexa.SpeakerAlexa.StepSpeaker ボリュームの設定や調整、対応ビデオデバイスのミュートやミュート解除を行うディレクティブを提供します。ボリュームを連続した値の範囲の任意の整数値に設定または調整できるデバイスには、Speakerインターフェースを実装します。ボリュームの範囲が不明で段階的なボリューム調整のみができるデバイスには、StepSpeakerインターフェースを実装します。
コンテンツカタログの取り込み Alexaにメディアコンテンツのカタログを提供する方法を説明します。カタログを取り込むことで、チャンネル、TV番組、映画などのメディアエンティティの音声認識精度が向上します。
ラインナップとMSO情報 ライブTVプロバイダーが、MSO名と各ユーザーまたはZIPコードに固有のラインナップを指定する方法を説明します。