Amazonは本日、音声ファースト・マルチモーダルなスキルの開発を支援する、新デザイン言語 Alexa Presentation Language (APL)と関連ツールの開発者プレビューを発表しました。音声ファースト・マルチモーダルとは、音声を主体としながらも、必要に応じて画面表示やタッチ操作など多様な方法でのユーザー対話を自在に組み合わせたインターフェースのことを意味します。音声ファースト・マルチモーダルなスキルは、幅広いユーザーやユースケースに対して、自然で使いやすく魅力的な体験を提供することができます。
すでに膨大な数のユーザーが、Amazonやサードパーティから提供されている画面付きのAlexaが使えるデバイスを利用しています。スキル開発者はAPLを利用することで、リッチテキスト、画像、スライドショー、ビデオなど、豊かなビジュアル表現を組み合わせたユーザー対話を、各デバイスの特性に合わせながら簡単にデザイン・ビルド・配信することができます。
12月に発売を予定しているEcho Showをはじめ、既存のEcho SpotでもAPLを用いた音声ファースト・マルチモーダルなスキルに対応する予定です。また本日発表されたAlexa Smart Screen and TV Device SDKを利用することで、サードパーティのAlexa搭載デバイスも順次APL対応がされる予定です。
音声ファースト・マルチモーダルなスキル開発の支援
APLは、マルチモーダルなスキル開発向けに設計された新しい言語で、Alexa Skill Kit (ASK)に含まれます。APLを利用することで、次のようなスキルの開発が可能になります。
- リッチ: テキスト、イメージ、スライドショー、そして将来オーディオやビデオストリームなどをマルチモーダルなユーザー体験に利用することができます。画面上のテキストと音声の出力を同期させることもできますし、デバイスによっては、ボイスコマンドと並行して、タッチ操作やリモコンでの操作もサポートすることができます。
- フレキシブル: APLでは、自由にビジュアル表現を定義することができます。あなたのブランドイメージにマッチした素敵なデザインを構築することができます。
- 最適化: Alexaに対応したデバイスは、画面がないもの、円形画面のもの、四角画面のものなど様々なタイプがありますが、APLではそれぞれの特性に合わせてユーザー体験を構築することができます。
- 簡単: Amazonは各種デバイスの特性に合うようにデザインされたサンプルAPLドキュメントを提供します。それらをそのまま使うこともできますし、必要に応じてカスタマイズして利用したり、まったく独自のものをデザインしたりすることもできます。
ASKにはAPLオーサリングツールとテストシミュレータも提供されますので、APLドキュメントの編集とそのプレビュー確認を繰り返し行うことができます。
利用できるAPLコンポーネント
APLを用いた開発では、APLドキュメント(スキルからデバイスに配信されるJSONファイル)を作成します。デバイスは、配信されたAPLドキュメントを評価し、必要に応じてイメージや他のデータをインポートして、定義されたデザインのユーザー体験を実現します。APLドキュメントには以下を含めることができます:
- Text・Image・ScrollView: 用意された中からフォント・サイズ・カラー・ウェイトを指定したテキストや画像を画面に表示することができます。TouchWrapperを使うと、表示したテキストや画像をタッチ操作させることも可能です。TouchWrapperを使うと、ユーザーがこれらのアイテムの1つをタッチしたときに、自動的にスキルにイベントが送らます。また、テキストを複数の画面にわたって表示するScrollViewを使うこともできます。
- PagerとSequence: Pagerを使うと、複数あるアイテムを自動的に順次表示することができます。たとえば、スライドショーのような効果をPagerで簡単に行うことができます。あるいは、Sequenceを使うと、たとえば付近のレストランのように、連続したリストから1つを選択する場合にも利用できます。ユーザーは音声とスワイプ動作などにより画面を切り替えてアイテムを選択することができます。
- レイアウト: Image・Text・Scrollview・Pagerなどのコンポーネントはレイアウトとしてグループ化して、表示を同期したり、画面配置を一括して扱ったりすることができます。レイアウトはネストして使うことも可能です。たとえば、Amazonが提供するヘッダーやフッターの レイアウト を、あなたのレイアウトの中で利用することができます。 またレイアウト中では簡単な条件文も利用可能ですので、たとえば、円形画面のデバイスでは特定のレイアウト、四角画面のデバイスでは別のレイアウトをネストして、それぞれのデバイスに最適化した表現をすることができます。
- SpeakItem とその他のコマンド: スキルからオーディオや画面表示を変更するコマンドを送ることができます。あるいは、たとえばユーザーがボタンを押下したとき、ボタンの押下画像を表示するよう、APLドキュメント内にコマンドを自動生成するようにすることもできます。SpeakItemコマンドのhighlightModeプロパティを使うと、テキストの音声発話中の行やブロックをハイライトすることができます。SetPageとAutoPageコマンドでは、Pagerコンポーネントで表示されているページを制御します。
- ビデオ・オーディオストリームとHTML5 (近日予定): 近日中には、APLレイアウトの中にビデオ動画やオーディオストリームも使うことができるようになる予定です。再生が完了したらスキルの動作が継続します。さらにコンテンツとしてHTML5も表示可能になる予定です。
以上、簡単ですがAPLのご紹介でした。APLは来月一般向けにベータ版が公開される予定ですので、お楽しみにお待ちください。
APLを使って開発が進められているスキルのご紹介
- 出前館 では豊富なフードデリバリーのメニューをEcho ShowとEcho Spotの画面にカスタマイズされたレイアウトで表示し、ユーザーが簡単に選択できるように作られています。スキルにAmazon Payを搭載し、シンプルに決済とデリバリーが可能となります。
- JTBおでかけチケットではAPLをきっかけにスキルがパワーアップしました。APLのPagerを使い施設画像のスライドショーを実現、SpeakItemを使い自動スクロールでチケット施設の情報が一段と見やすくなりました。また、スキル内にAmazon Payを実装したことにより、電子チケットの購入が可能になります。
- クックパッドではAPLを活用した画面で、レシピをより分かりやすく確認できるようになりました。特にEcho ShowではAPLのレイアウト機能を使って、レシピの材料や手順を見やすい一覧の形で大きな画面に表示します。
- もぐもぐワオっちではEcho Spot, Echo Showそれぞれで最適なサイズやレイアウトで表示すると共に、PagerやAutoPage/SetPageコマンドを用いて画像をスライドショーのように動かします。
これ以外にも、京橋ワイン、サルヴァトーレ、サントリーコミュニケーションズ、日産自動車、ヤフー、リクルート、リンベル、QUICKなどがよりよいユーザー体験を提供するため、すでにAPLを利用したスキルの開発を進めています。