APL for Audio(ベータ版):新しいオーディオミキシング機能でリッチなエクスペリエンスを実現する

Catherine Gao Sep 29, 2020
Share:
Alexa Live Content Skills Launch Kid Skills Multimodal News
Blog_Header_Post_Img

※このブログはIntroducing APL for Audio (Beta): Build Rich Audio Experiences with New Audio Mixing Capabilitiesを翻訳したものです。

このたび、新しいオーディオミキシング機能であるAPL for Audio(ベータ版)が発表されました。APL for Audioを使用すると、すべてのAlexa搭載デバイスで、音声、効果音、音楽などのオーディオを実行時にミキシングできます。これらの新機能は、既存のAlexa Presentation Language(APL)フレームワークを拡張し、没入感の高い魅力的なオーディオエクスペリエンスを容易に実現できるようにしたものです。時間や手間、コストをかけて、事前にミキシングする必要はありません。その日の予報に合わせて効果音をミキシングする天気予報スキルや、プレーヤーの入力に応じて効果音を動的に生成する没入型ゲームなど、楽しく、興味をそそるユーザーエクスペリエンスを作成できます。この機能を使用するにあたり、APLインターフェースを有効にする必要はありません。APL for Audioは、Echoデバイスやサードパーティ製デバイス(Sonosスピーカー、Boseヘッドホン、LG TVなど)を含め、すべてのAlexa搭載デバイスでサポートされます。すぐに使ってみたい場合は、技術ドキュメントで詳細をご確認ください。Githubのコードリポジトリでは、APL for Audioのサンプルをご覧いただけます。

リッチなオーディオエクスペリエンスを作成

APL for Audioを実装すると、すべてのAlexa搭載デバイスでリッチなオーディオエクスペリエンスを実現できます。サンプリングレートやファイルタイプの制約といった長年の問題が改善され、再現性の高いオーディオファイル(サンプリングレートは最大44.1kHz、1411.20kbps)を使用できるようになりました。これは音楽ストリーミングの品質に匹敵します。使用可能なファイルタイプも増え、.aac、.mp3、.ogg、.opus、.wavがサポート対象となりました。さらに、1回の応答で15ファイルまでレンダリング可能なため、没入感が高まり、よりリッチで多彩なオーディオエクスペリエンスを実現できます。

Doppio GamesThe Vortexスキルのサウンドデザイナーを務めるJoao Costa氏は、「The VortexをAPL for Audioに切り替えたところ、ファイルのサンプリングレートの向上によって音質がアップし、オーディオフォーマットの柔軟性も高まりました。また、これまで連続的に再生されていたオーディオクリップの機能が改善され、より複雑でダイナミックな対話が可能になりました。複数のサウンドを重ねて再生できるため、これまで以上にユーザーをゲームの世界に引き込むことができます」と説明します。

オーディオと音声を実行時にミックス

APL for Audioでは、オーディオとAlexaのスピーチをミックスしたり、効果音やその他のオーディオクリップと複数の音声を同時に再生したりすることができます。ユーザーからの入力に応じてレイヤー化された効果音やナレーションをプログラムで生成し、視覚要素と同期させて再生することも可能です。フェードイン、フェードアウト、トリミングなどの音量フィルターを使用すれば、より自然なサウンドが得られます。

Creativity IncのAnimal Rockでは、APL for Audioをサポートしている音声アプリ作成ツールであるVoiceflowを使用して、臨場感あふれるサウンドを実現しています。このスキルでは、プレーヤーが4種類の楽器を自由に組み合わせて演奏できます。同社のマーケティング・開発部門でシニアディレクターを務めるCaitlin Gutekunst氏は、「複数のパートを動的にミキシングできるため、曲目ごとに何百ものバージョンを手動で作成しなくても、ゲームユーザーは700以上の組み合わせで楽曲を聴くことができます」と話します。また、VoiceflowのCEOであるBraden Ream氏は、「当社のビジュアルビルダーには高度なオーディオをレイヤー化する機能が備わっています。デザイナーや開発者はVoiceflowとAlexaを使用し、新しいさまざまな方法を試してみることができます」と説明します。

オーディオサンプルを聴く
APL for Audioの使用方法

読み上げテキストからオーディオ応答を生成し、APLコンポーネントを使用してオーディオクリップを再生するには、ドキュメントタイプにAPLAを指定します。

APLオーサリングツールを使用してドキュメントを作成すると、オーディオ応答をすぐに確認できます。

Alexa.Presentation.APLA.RenderDocumentディレクティブを使用し、スキル応答の一部としてオーディオがレンダリングされるようにします。APL for Audioは、既存のoutputSpeech機能およびreprompt機能と併用できます。 

APLAドキュメントでは、次のAPLコンポーネントを使用できます。

  • Audio: 指定されたオーディオクリップを再生します。ASKサウンドライブラリのURLを使用するか、再生するオーディオクリップのソースURLを指定できます。

Copied to clipboard
{
    "type": "Audio",
    "source": "soundbank://soundlibrary/animals/amzn_sfx_bird_forest_short_01"
}

  • Speech: テキストを音声に変換します。サポートされているSSMLタグを使用して、スキル応答にAlexaのスピーチを追加できます。さまざまなスピーチスタイルや感情表現を取り入れ、より自然で直感的な音声を作成します。

Copied to clipboard
{
    "type": "Speech",
    "contentType":"SSML",
    "content": "${payload.data.ssml}"
}

  • Mixer: 複数のタイプのオーディオと音声を同時に再生します。

Copied to clipboard
{
    "type": "Mixer",
    "items": [
        {
            "type": "Speech",
            "content": "現在の気温は26度で晴れています。"
        },
        {
            "type": "Audio",
            "source": "${payload.data.audio}",
            "filters": [
                {
                    "type": "Volume",
                    "amount": "30%"
                }
            ]
        }
    ]
}

  • Selector: 指定された条件に基づいて、特定のオーディオまたは音声コンポーネントを再生します。strategyプロパティを使用すると、さまざまなストラテジーがランダムに選択されるため、対話のたびに異なる効果音を再生してユーザーを引き付けることができます。

Copied to clipboard
{
    "type": "Selector",
    "strategy": "normal",
    "items": [
        {
            "type": "Speech",
            "when": "${payload.data.currentTemp > '30'}",
            "content": "${payload.data.forecast} こまめに水分補給をしましょう!"
        },
        {
            "type": "Speech",
            "source": "${payload.data.forecast}"
        }
    ]
}

  • Sequencer オーディオファイルと音声ファイルを1つずつ順番に再生します。

Copied to clipboard
{
    "type": "Sequencer",
    "items": [
        {
            "type": "Speech",
            "content": "現在の気温は5度で雨が降っています。雨音が聞こえますか?"
        },
        {
            "type": "Audio",
            "source": "soundbank://soundlibrary/nature/amzn_sfx_rain_01"
        }
    ]
}

  • Silence ほかのオーディオコンポーネントまたは音声コンポーネントの間に無音の一時停止を追加します。

Copied to clipboard
{
    "type": "Silence",
    "duration": 1500
}
開発を始めましょう

まずAPL for Audio(ベータ版)の詳細を確認し、サンプルスキルに目を通しましょう。ご質問がある場合は、Twitterでプロダクトマネージャー(@austinvach)にお問い合わせください。

関連記事

31の新機能で、より自然で没入感のあるAlexaエクスペリエンスを実現
定型アクションからスキルを呼び出せるようになりました
Alexa道場に新しいシリーズがスタートしました

Subscribe