スキルに視覚要素とオーディオを追加する

スキルに視覚要素とオーディオを追加する

Alexa Presentation Language(APL)を使用して、グラフィック、画像、スライドショー、ビデオ、アニメーションなどの、スキルの視覚エクスペリエンスを作成できます。APLは、Alexaを搭載したマルチモーダルデバイスに視覚要素やオーディオ要素をレンダリングするレスポンシブ対応のレイアウト言語です。また、Alexa for Audioを用いてオーディオ応答を構築すると、複数のAlexaの音声、効果音、BGMをミックスして重ねることもできます。オーディオ応答と視覚応答を組み合わせることができます。

視覚応答とオーディオ応答は、Echo Show、テレビ、Alexa搭載タブレットなど、画面付きのデバイスで動作します。オーディオ応答は、Amazon EchoやEcho Dotなどのスピーカーデバイスでも動作します。

APLコンテンツはスキル応答の一部

カスタム音声モデルのスキルは、リクエストと応答のインターフェースを使用します。Alexaは、AWS Lambda関数やウェブサービスにLaunchRequestIntentRequestなどのリクエストを送信します。スキルがこのリクエストを処理し、応答を返します。

APLはこのフレームワークで動作します。スキルが応答を返す際、視覚応答を表示したりオーディオ応答を再生したりするディレクティブを含めます。ディレクティブには2つの項目を渡します。

  • APLドキュメント。視覚またはオーディオのテンプレートを定義するJSONオブジェクトです。ドキュメントは、応答の構造とレイアウトを提供します。ドキュメントの条件付きロジックにより、さまざまなデバイスや状況にテンプレートを適応させることができます。
  • APLデータソース。定義を行うJSONオブジェクトです。データソースは、テンプレートに入力するコンテンツを提供します。ユーザーがスキルを呼び出したときに変わる可能性のあるコンテンツには、データソースを使います。このアプローチにより、視覚やオーディオの表現とデータを切り離すことができます。

ユーザー: アレクサ、ハローワールドを開いてハローと言って。

Alexaは「ハローワールド」スキルにIntentRequestを送信します。スキルは、音声と視覚のコンテンツを含む応答を返します。
Alexa: ハローワールド。 (Alexaはこの応答を読み上げ、同時に画面上に視覚コンテンツを表示します)

スキル応答の一部として表示される視覚要素
スキル応答の一部として表示される視覚要素

ユーザーはさまざまな方法でAPL応答と対話可能

ユーザーは、画面を使ってAlexa搭載デバイスと対話できます。たとえば、ユーザーはEcho Showデバイスのタップボタンやリモコンを使って画面を操作したり、Fire TVデバイスで項目を選択したりできます。ほかのAlexaデバイスと同じように、音声でスキルにリクエストを伝えることもできます。

APLを使って作成した視覚応答は、これらの入力モードを使用できます。ボタンやタッチ可能な項目をAPLドキュメントで定義して、この項目がコマンドを実行します。コマンドにより、画面上に表示されるテキストを変えるなど、画面の外観を変更することができます。コマンドは、リクエストとしてスキルにメッセージを送信することもできます。これらのリクエストのハンドラーを記述します。記述方法は、IntentRequestなどの音声リクエストで記述したインテントハンドラーと同様です。

音声対話の場合、音声リクエストをキャプチャするインテントとコードでそれらのリクエストを処理するインテントハンドラーを定義します。AlexaがスキルにIntentRequestを送信する際、リクエストには画面に表示されるAPLコンテンツに関する情報が含まれます。ハンドラーはこの情報を使って関連する応答を提供できます。

APLはさまざまなデバイスに対応可能

APLはオーディオと視覚の両方のコンテンツ表現に使用できます。

  • APL for Audioを使ってすべてのAlexaデバイスでリッチなオーディオコンテンツを再生します。
  • Echo Show、Fireタブレット、Fire TVなどの画面付きデバイスにコンテンツを表示します。APLは、ユーザーインタラクションと、画像、ビデオ、アニメーションなどのリッチコンテンツを完全にサポートします。

    画面付きデバイスの種類や形状はさまざまです。条件付きロジックを使って、デバイスに合うようにデザインを適応させることができます。たとえば、横長のデバイスでは横方向のリスト、縦長のデバイスでは縦方向のリストを表示することができます。

  • Echo Dot with clockなど、英数字クロックディスプレイ付きのデバイスにコンテンツを表示します。APL機能の限定セットを使って、これらのデバイスにコンテンツを表示できます。

    APLは、ディスプレイ上の英数字データ表示をサポートしています。また、テキストのスクロールや、タイマーやカウントダウン表示などのユニークな機能もサポートしています。詳細については、Alexa Presentation Languageとキャラクターディスプレイの概要を参照してください。

APLの概念は、異なるデバイスでも共通しています。

APLのさまざまな要素についての詳細

オーディオ応答や視覚応答を作成する際に使用するAPLのすべての要素については、APLの視覚応答を構成する要素を参照してください。

チュートリアルやトレーニングコースで開発を始める

APLを紹介する簡単なチュートリアルで開発を始めるには、チュートリアル: 初めての視覚応答をカスタムスキルに追加するを参照してください。

APLについてオンラインコースで学習するには、Alexa Learning Labを参照してください。APLを使って視覚表現豊かなエクスペリエンスを作成するカリキュラムから始めましょう。