※このブログはIntroducing APL for Audio (Beta): Build Rich Audio Experiences with New Audio Mixing Capabilitiesを翻訳したものです。
このたび、新しいオーディオミキシング機能であるAPL for Audio(ベータ版)が発表されました。APL for Audioを使用すると、すべてのAlexa搭載デバイスで、音声、効果音、音楽などのオーディオを実行時にミキシングできます。これらの新機能は、既存のAlexa Presentation Language(APL)フレームワークを拡張し、没入感の高い魅力的なオーディオエクスペリエンスを容易に実現できるようにしたものです。時間や手間、コストをかけて、事前にミキシングする必要はありません。その日の予報に合わせて効果音をミキシングする天気予報スキルや、プレーヤーの入力に応じて効果音を動的に生成する没入型ゲームなど、楽しく、興味をそそるユーザーエクスペリエンスを作成できます。この機能を使用するにあたり、APLインターフェースを有効にする必要はありません。APL for Audioは、Echoデバイスやサードパーティ製デバイス(Sonosスピーカー、Boseヘッドホン、LG TVなど)を含め、すべてのAlexa搭載デバイスでサポートされます。すぐに使ってみたい場合は、技術ドキュメントで詳細をご確認ください。Githubのコードリポジトリでは、APL for Audioのサンプルをご覧いただけます。
APL for Audioを実装すると、すべてのAlexa搭載デバイスでリッチなオーディオエクスペリエンスを実現できます。サンプリングレートやファイルタイプの制約といった長年の問題が改善され、再現性の高いオーディオファイル(サンプリングレートは最大44.1kHz、1411.20kbps)を使用できるようになりました。これは音楽ストリーミングの品質に匹敵します。使用可能なファイルタイプも増え、.aac、.mp3、.ogg、.opus、.wavがサポート対象となりました。さらに、1回の応答で15ファイルまでレンダリング可能なため、没入感が高まり、よりリッチで多彩なオーディオエクスペリエンスを実現できます。
Doppio GamesでThe Vortexスキルのサウンドデザイナーを務めるJoao Costa氏は、「The VortexをAPL for Audioに切り替えたところ、ファイルのサンプリングレートの向上によって音質がアップし、オーディオフォーマットの柔軟性も高まりました。また、これまで連続的に再生されていたオーディオクリップの機能が改善され、より複雑でダイナミックな対話が可能になりました。複数のサウンドを重ねて再生できるため、これまで以上にユーザーをゲームの世界に引き込むことができます」と説明します。
APL for Audioでは、オーディオとAlexaのスピーチをミックスしたり、効果音やその他のオーディオクリップと複数の音声を同時に再生したりすることができます。ユーザーからの入力に応じてレイヤー化された効果音やナレーションをプログラムで生成し、視覚要素と同期させて再生することも可能です。フェードイン、フェードアウト、トリミングなどの音量フィルターを使用すれば、より自然なサウンドが得られます。
Creativity IncのAnimal Rockでは、APL for Audioをサポートしている音声アプリ作成ツールであるVoiceflowを使用して、臨場感あふれるサウンドを実現しています。このスキルでは、プレーヤーが4種類の楽器を自由に組み合わせて演奏できます。同社のマーケティング・開発部門でシニアディレクターを務めるCaitlin Gutekunst氏は、「複数のパートを動的にミキシングできるため、曲目ごとに何百ものバージョンを手動で作成しなくても、ゲームユーザーは700以上の組み合わせで楽曲を聴くことができます」と話します。また、VoiceflowのCEOであるBraden Ream氏は、「当社のビジュアルビルダーには高度なオーディオをレイヤー化する機能が備わっています。デザイナーや開発者はVoiceflowとAlexaを使用し、新しいさまざまな方法を試してみることができます」と説明します。
読み上げテキストからオーディオ応答を生成し、APLコンポーネントを使用してオーディオクリップを再生するには、ドキュメントタイプにAPLAを指定します。
APLオーサリングツールを使用してドキュメントを作成すると、オーディオ応答をすぐに確認できます。
Alexa.Presentation.APLA.RenderDocumentディレクティブを使用し、スキル応答の一部としてオーディオがレンダリングされるようにします。APL for Audioは、既存のoutputSpeech機能およびreprompt機能と併用できます。
APLAドキュメントでは、次のAPLコンポーネントを使用できます。
{
"type": "Audio",
"source": "soundbank://soundlibrary/animals/amzn_sfx_bird_forest_short_01"
}
{
"type": "Speech",
"contentType":"SSML",
"content": "${payload.data.ssml}"
}
{
"type": "Mixer",
"items": [
{
"type": "Speech",
"content": "現在の気温は26度で晴れています。"
},
{
"type": "Audio",
"source": "${payload.data.audio}",
"filters": [
{
"type": "Volume",
"amount": "30%"
}
]
}
]
}
{
"type": "Selector",
"strategy": "normal",
"items": [
{
"type": "Speech",
"when": "${payload.data.currentTemp > '30'}",
"content": "${payload.data.forecast} こまめに水分補給をしましょう!"
},
{
"type": "Speech",
"source": "${payload.data.forecast}"
}
]
}
{
"type": "Sequencer",
"items": [
{
"type": "Speech",
"content": "現在の気温は5度で雨が降っています。雨音が聞こえますか?"
},
{
"type": "Audio",
"source": "soundbank://soundlibrary/nature/amzn_sfx_rain_01"
}
]
}
{
"type": "Silence",
"duration": 1500
}
まずAPL for Audio(ベータ版)の詳細を確認し、サンプルスキルに目を通しましょう。ご質問がある場合は、Twitterでプロダクトマネージャー(@austinvach)にお問い合わせください。