31の新機能で、より自然で没入感のあるAlexaエクスペリエンスを実現

Nedim Fresko Jul 28, 2020
Share:
Alexa Live Mobile Accessories Make Money Dialog Management Multimodal Reach Customers
Blog_Header_Post_Img

※このブログは、31 New Features to Unlock More Natural and Immersive Alexa Experiences の翻訳です。このブログで紹介しているスキルは日本語に対応していない場合があります。

今やAlexaデバイスは何億台にものぼり、ユーザーは、スマートスピーカー、スマートテレビ、ヘッドフォン、PCなどから毎週何十億回もAlexaと対話しています。Alexaスキルへのエンゲージメントは、昨年の2倍を超えました。Amazonは、Alexa Skills Kit(ASK)の機能やエクスペリエンスについて皆様からいただいたフィードバックをもとに開発を進め、このたび31の新機能を発表いたします。


これらの新機能では、ユーザーが厳しい制約に縛られることなく、スキルと自然に会話できるようになります。同時に、開発者には、スキルの最大の価値であるエクスペリエンスに集中できるようにします。ほかにも、実行時のオーディオトラックミキシング、ゲーム向けHTML5などのウェブ技術を駆使することで、音声に充実したサウンドや視覚効果、タッチ操作を組み合わせた没入感の高いマルチメディアエクスペリエンスを提供できます。ユーザーが外出先で利用し、他の操作を終えた後にシームレスに再開できる新たなエクスペリエンスを作り出すこともできます。ユーザーが音声とモバイルアプリを同時に使って、音声だけでいくつかのタスクを実行し、必要に応じてほかの操作手段も加えたアプリのフルエクスペリエンスに切り替えることも可能です。最後に、スキルやプレミアムエクスペリエンスを多くのユーザーに見つけてもらいやすくし、使い勝手をさらに向上させられるようになりました。

より自然なエクスペリエンスを実現

自然なエクスペリエンスを提供するには、個々の単語や文章を理解する力だけでなく、会話的なフレーズや想定外のリクエストに幅広く対応できる力も必要となります。

Amazonでは、ディープニューラルネットワーク(DNN)を採用し、Alexaが個々の単語や文章を理解する自然言語理解(NLU)の能力を高めています。カスタムスキルへの導入を開始したところ、ユースケースにより違いはあるものの、早期の結果は上々でした。Amazonでは、このDNNベースのNLUの利用で、平均15%の精度向上を見込んでいます。また、このDNNが素晴らしいのは、スキルには一切変更が必要ない点です。導入と同時に、自動的にスキルの精度が向上します。

Alexa Conversations(ベータ版)は、ダイアログ管理をAI主導で行う新たなアプローチです。ユーザーが直感的なフレーズを好きな順序で使い、自然でわかりやすい方法で対話できるスキルを開発できます。一方で開発者も、スキル最大の価値であるエクスペリエンスに集中できます。従来のダイアログ管理機能と異なり、Alexa Conversations(ベータ版)では、コーデイングしたり、ユーザーがスキルと対話する方法のバリエーションをすべて列挙したりする必要がありません。代わりに、ダイアログサンプルのセットと、それらをスキルの具体的なサービスにどうマッピングするかを指定します。Alexa Conversations(ベータ版)は、ディープラーニングを採用してユーザーが使う可能性のあるさまざまなダイアログパスを推測し、学習結果をリアルタイムに反映してユーザーの対話を自動管理します。たとえば、状態のトラッキング、コンテキストの保持、ユーザー主導の修正の承認を行い、適切なタイミングでサービスを呼び出します。iRobotPhilosophical Creationsでは、既にAlexa Conversations(ベータ版)を利用しています。

「Alexa Conversationsは、開発者に大きな革新をもたらします。そして、ユーザーにとっても素晴らしいエクスペリエンスが実現します」と、Philosophical Creationsの創業者であるSteven Arkonovich氏は言います。「Alexa Conversationsを使ってBig Skyスキルをアップデートしたところ、ユーザーはより自然に会話し、会話の途中で考えを変えたりもできるようになりました。 スキルコードにほとんどデータを入力していなくても、ユーザーとの会話をすべてAlexa AIがトラッキングしてくれるのです。」

これらの機能は、en_US(英語、米国)のスキルで利用可能です。DNNの詳細については、Alexa Scienceの記事(英語)およびAlexa Consversationsのブログ(英語)を参照してください。

オーディオとビジュアルで没入感の高いエクスペリエンスを実現

ユーザーは、多彩なサウンドやビジュアルを駆使した没入感の高いエクスペリエンスで情報を得、声とタッチの両方で操作したいと考えています。Alexa Presentation Language(APL)は、こうしたエクスペリエンスを統合できる技術です。

APL for audio(ベータ版)を使えば、Alexaでスピーチ、サウンドエフェクト、音楽などのオーディオを実行時にミキシングできます。APL for audio(ベータ版)により、魅力的で没入感の高いオーディオエクスペリエンスを提供できます。事前ミキシングの時間、労力、そしてコストも必要ありません。 AudibleCreativity IncDoppio GamesKrogoor Entertainment StudioStoked SkillsVolleyといった企業が既にAPL for audio(ベータ版)を利用しています。

「APL for audioは、手作業のオーディオ編集に頼ることなく、多彩なオーディオ表現を可能にしてくれる強力なツールです。テキスト読み上げ(TTS)とバックグラウンドオーディオをミキシングすることで、より動的に応答できます」と、Stoked Skills創業者のGal Shenar氏は語ります。

Alexa Web API for Gamesを使えば、ウェブ技術の知識を利用して、画面付きデバイス上に、印象的な見た目で動きのある、マルチモーダルなAlexaゲームを作成できます。Web API for Gamesは、HTML5、Web Audio、CSS、Javascript、WebGLに対応しています。 Doppio GamesLC PublishingVocala.coVoice App LabsZynga といった企業が、既にこのAPIを使ったゲームスキルを公開しています。

「この機能は、多彩なユーザーインターフェースを追加して音声ファーストなデザインを強化する素晴らしいツールです。
プレイヤーをDark Citadelの世界に引き込み、新たなプレイの形を提供できます」と、LC PublishingのスキルクリエイターであるRyan Jordan氏は語ります。「Web APIにより、まったく新しいゲームデザインの境地が開かれました。」

最新バージョンのAPL 1.4では、編集可能なテキストボックス、ドラッグアンドドロップのUIコントロール、前の画面に戻る機能などが追加されました。また、最新のAPLオーサリングツールではライブプレビュー機能も搭載されました。ASK toolkit for VS Codeでは、新しいAPLのオーサリングとプレビューがサポートされます。APL 1.4には、アニメーションとベクターグラフィックスといったこれまでの機能強化も含まれています。

「ユーザーをワクワクさせるためにAPLを使っています。ユーザーがMath Mountainの頂上に到達したときに、花火のような楽しいアニメーションを多彩な表示コンテンツに組み合わせることで、魅力的な多次元のエクスペリエンスを実現し、リピーターを増やすことができます。APLを使えば、スキルがとにかく楽しくなるのです」と、Seaside Voice Appsの創業者、Brandon Nourse氏は語ってくれました。

これらの機能は、すべてのAlexaロケールで利用可能です。 詳細については、APL for Audioのブログ(英語)Alexa Web API for Gamesのブログ(英語)APL 1.4のブログ(英語)をご覧ください。

シームレスなエクスペリエンスを外出先でも

Amazonでは昨年、ユーザーが外出先でもAlexaを利用できるEcho AutoやEcho Budsなどのデバイスをリリースしました。FitbitのVersa 2、BoseのAlexa搭載ヘッドフォンにも同じ機能が搭載されています。ユーザーからのフィードバックによると、彼らが外出先でAlexaに話しかけ、情報を得たり、音楽を聴いたりできる点をどれだけ気に入っているかがわかります。ユーザーは外出先でAlexaにほかにもいろいろなことを手助けしてほしいと考えているようです。

スキル再開機能(プレビュー版)を使うと、Alexaにほかのタスクを実行させたり、別のアクティビティが実行された後に、簡単にスキルに戻ることができます。ユーザーは、スキルに新しい情報が追加された場合に自動で再開させることもできますし、再開するようリクエストすることもできます。Alexaは、ユーザーがそのスキルを使っていたことを記憶しているため、ユーザーが改めてスキル名を伝える必要はありません。たとえば、ユーザーが配車の予約をした後、Uberはスキル再開機能を使用して「Uberが到着しました」と自動で報告できます。 ユーザーが「アレクサ、Uberは今どの辺にいるの?」とたずねることもできます。

スキル再開機能(プレビュー版)は、en_US(英語、米国)のスキルで利用可能です。詳細についてはスキルの再開機能のブログ(英語)で確認し、こちらからプレビューに申し込むことができます。

Alexaスキルとモバイルアプリを統合

外出先で利用する場合、音声は非常に便利ですが、ときにはもっと詳しい情報が必要になることがあります。

Alexa for Apps(プレビュー版)では、AlexaスキルをiOSやAndroidのモバイルアプリと組み合わせて使用することで、ユーザーが両方のメリットを活用できます。つまり、手を使わずに声を使ってさまざまなタスクを実行できるだけでなく、必要に応じて音声、タッチ、視覚要素の操作手段を選べるようになります。Alexa for Apps(プレビュー版)を使えば、音声で検索結果を表示したり、詳細な情報を表示したり、その他のアプリ機能にアクセスしたりすることが可能です。たとえば、以前は、Twitterのトレンドやメンション機能を使う際、Twitterスキルにリクエストして、応答を聞く必要がありました。これからは、「アレクサ、TwitterでハッシュタグAlexaLiveを検索して」と言うだけで、スマートフォンのTwitterアプリが開き、検索結果を確認できるのです。同様に、TikTokユーザーもまもなく、「アレクサ、TikTokで録画を開始して」とハンズフリーで操作できるようになります。 Alexa for Apps(プレビュー版)は、Yellow PagesSonicVolleyで既に利用されています。

「Alexa for Appsのおかげで、ユーザーはモバイルアプリを開いてエピソードを探し、再生ボタンを押さなくても、聴きたいVolley FMのエピソードをシームレスに再生できます」と、Vollyのユーザーエクスペリエンス担当部長、Jess Thornhill氏は話します。「音声だけでは実行できないタスクにも使えて非常に便利です。」

Alexa for Apps(プレビュー版)は、すべてのAlexaロケールで利用可能です。 詳細については、Alexa for Appsのブログ(英語)をご覧ください。プレビュー版への参加はこちらから申し込みできます。

スキルとプレミアムなエクスペリエンスでエンゲージメントを強化

Alexaでどのようなエクスペリエンスを作ったとしても、見つけやすく、使いやすくなければ、ユーザーはそのメリットを得られません。声だけでは、新しいエクスペリエンスを発見し、呼び出し名を覚えておくのが難しい場合もあります。

Quick Links for Alexa(ベータ版)は、クリックでスキルを起動できるリンクを、モバイルアプリ、ウェブサイト、オンライン広告に追加できる機能です。ユーザーはスキルに簡単にアクセスでき、開発者もオンライン広告からのコンバージョンを追跡しやすくなります。 CNBCDominosMatchboxViacom CBSが、既にQuickLinks for Alexa(ベータ版)を利用しています。

「リンクから直接スキルを開けるので、Comedy Central Standupスキルなど、当社のスキルのマーケティング力を飛躍的に向上させられます」と、Viacom CBSの音声アシスタント担当VP、Mark Mezrich氏は語ります。「ユーザーに当社の広告の内容を覚えてもらう代わりに、直接スキルを開いてもらえるのです。」

無指名対話(NFI)ツールキット(プレビュー版)は、スキル起動の際にAlexaが検討する追加のシグナルを提供できる機能です。このツールキットを使えば、起動フレーズを最大5つまで設定できます。たとえば、旅行計画のスキルの場合、「アレクサ、旅行の計画を手伝って」などのフレーズを指定できます。 Alexaが検討可能なスキル内の具体的なインテントを指定することもできます。たとえば、旅行計画スキルでは、電車の時刻を取得するインテントを無視名対話に設定することができます。そうすることで、ユーザーが「京都駅までの次の列車はいつ?」とたずねた場合、Alexaはこのスキルで応答することを検討します。NFIツールキット(プレビュー版)では、呼び出しダッシュボードも提供されています。ここには、ユーザーがスキルの呼び出しに使うパスが表示されます。スキルごとに結果は異なりますが、NFIツールキット(プレビュー版)を早期に導入したスキルの中には、対話が15%増加したものもありました。

スキル内課金の機能が拡張され、音声だけでなく、AmazonサイトやEchoの画面付きデバイスからも購入できるようになりました。これにより、希望する人には従来の購入エクスペリエンスを提供したり、プレミアムコンテンツを直接リンクから購入できるようになります。また、スキル内課金を提供しているほとんどの開発者は、何もしなくてもこの機能を有効にできます。

Quick Links for Alexa(ベータ版)とAmazon.comサイトおよび画面付きEchoデバイスからスキル内商品を購入する機能は、en_US(英語、米国)とes_US(スペイン語、米国)で利用可能です。NFIツールキット(プレビュー版)は、英語(米国、英国、インド)で利用可能です。詳細については、Quick Links for Alexaとスキル内課金のブログ(英語)、およびNFIツールキットのブログ(英語)をご覧ください。NFIツールキット(プレビュー版)への参加は、こちらから申し込みできます。

今すぐ開発を始める

Alexa Live基調講演で紹介した31の機能すべて、およびASK SDKやツールの最新情報については、Alexa Liveリリースのまとめ(英語)で確認できます。また、Alexa Liveの技術セッションの録画を視聴して、すぐに開発に着手いただくことも可能です。その他、ご質問があれば、Alexaエバンジェリストや製品エキスパートによるオフィスアワーで、ぜひお問い合わせください。

最後に、Amazonでは、Alexaスキルチャレンジ:Alexa Conversationsへの参加を募集しています。このチャレンジでは、Alexa Conversationsを使って最も自然で魅力的なエクスペリエンスを開発した開発者に、最大$100,000の賞金を授与します。公開中の既存Alexaスキルの機能が最も向上したスキル、最高の新しいゲームなど、特別賞もご用意しています。(現在Alexa Conversations は、en_US localeでのみ使用可能です。)
 

どうぞ奮ってご応募ください。

関連記事

Introducing Alexa Conversations (beta), a New AI-Driven Approach to Providing Conversational Experiences That Feel More Natural
Enter the Alexa Skills Challenge: Alexa Conversations to Compete for Over $100,000 in Prizes
Reach More Customers with Quick Links for Alexa (Beta) and New In-Skill Purchasing Options

Subscribe