あなたのAlexaダッシュボード 設定

オーディオコンテンツのラウドネス値の正規化

オーディオコンテンツのラウドネス値の正規化

フラッシュブリーフィングフィードまたはカスタムスキルで使用するためにAlexaのオーディオコンテンツを作成するとき、オーディオコンテンツがAlexaの音声として一定レベルのラウドネスで再生することが重要です。また、音声クリップは音声を変動させないように、一定レベルで再生する必要があります。テレビを見ているとき、コマーシャルの音量が他のコンテンツより大きいと気づいたことがあれば、ラウドネスレベルが一定しない不快さを理解できるでしょう。音声クリップがガイドラインに従って一定レベルで再生されないと、スキルが認証に合格できません。

ラウドネスの要件

ラウドネスメーターと呼ばれるツールを使用して、音声のラウドネスを標準化します。ラウドネスメーターは、音声をラウドネス単位(LU)で測定します。ラウドネスメーターはピークメーターや波形メーターとは異なり、音声の電圧レベルを測定するのではなく、人間が耳で聞いた音をどのように感じるかを測定します。

ラウドネスユニットフルスケール(LUFS)とは、放送するオーディオコンテンツの標準化に特化して開発されたラウドネス企画であり、Alexaで再生される音声クリップに使用されます。Alexaには次のようなラウドネスガイドラインがあります。

  • Alexaのプログラムのラウドネス値が-14 dB LUFS/LKFSであること。
  • LUFSまたはLKFSを使用しない場合は、ラウドネス値をRMS合計値-15~-13dBの範囲に設定します。
  • トゥルーピーク値を-2dBFS以下に設定します。

通常、ラウドネスはデジタルオーディオワークステーション(DAW)とLUFSメーターを使用して測定します。これらのツールを使い慣れている場合は、音声クリップを測定し、前述のガイドラインに合わせて調整します。これらのツールを使ったことがなければ、次の手順に従って音声クリップを評価し、必要に応じて変更します。

音声クリップのラウドネスの測定と調整

以下の手順では、無料のオーディオエディターおよびレコーダーであるAudacityと、Audacityのプラグインとして動作する無料のデジタルオーディオマルチチャンネルメーターであるdpMeter IIを使用します。使い慣れたツールがある場合はこの手順を実行する必要はありません。そのツールを使用して音声ファイルを標準化できます。それ以外の場合は、以下の作業が必要です。

ツールのダウンロードとインストール

  • 使用しているオペレーティングシステムにAudacityをダウンロードし、インストールする
  • 使用しているオペレーティングシステムにdpMeter IIをダウンロードし、インストールする

プラグインとしてのdpMeter IIの有効化

  • プラグインとしてdpMeter IIを有効にするには、「Effect」メニューで「Add/Remove Plug Ins..」を選択します。
  • New」をクリックしてリストから「dpMeter II」を検索します。「Enable」をクリックしてから「OK」をクリックします。
  • ここで「Effect」メニューが再度表示されるので、「dpMeter II」を選択します。
Audacity Effectメニュー
  • dpMeter IIを起動したら、MODEに進んでEBU R128を選択してラウドネス単位をLUFSに変更します。これによってMODEの表示がEBUに変わります。
dpMeter II

ラウドネスの測定と調整

音声ファイルの再生に戻り、GAIN値を設定してラウドネスを調整します。最後にこのファイルをエクスポートします。

ファイルの再生

  • dpMeter IIで「File -> Open」に進み、評価する音声ファイルの1つを検索します。
  • インターフェースの下部にある緑の矢印をクリックして再生を開始します。
  • 音声ファイルが短い場合はファイル全体を再生し、長いファイルの場合は、数回再生して音声をサンプリングし、全体のラウドネス範囲を想定します。これは音声ファイルの複数のポイントで「Integrated Loudness」値を監視することで実行できます。ループ矢印をクリックするとラウドネス値をリセットできます。次の図でこれらを確認できます。

ラウドネスの調整

  • ラウドネスをどの程度調整すると、必要なプログラムのラウドネス-14 LUFSにできるかを計算します。サンプルの音量が小さすぎる場合は、-14未満の数値が登録されています。サンプルの音量が大きすぎる場合は、値が-14以上です。
  • GAINボックスに計算した値を入力し、「Apply」をクリックします。たとえば、ラウドネス値の平均が-20.1の音声ファイルの場合、6.0のGAIN値を入力すると、値が-14.1になります。

音量は、音声ファイルのどのポイントでもちょうど-14 LUFSに調整することはできませんが、この値にできる限り近づけることが重要です。

新しいMP3としてファイルを保存する

  • ラウドネスを調整したファイルをMP3としてエクスポートします。このためには、Audacityで「File -> Export Audio」を選択します。

    • Name」にファイル名を入力します。
    • Save as Type」で「MP3」を選択します。Audacityのこの機能をこれまでに使用していない場合、MP3エクスポートを有効にするためにLAMEをインストールするよう求められる場合があります。
    • Quality」で「Extreme (220-260 kbps)」を選択します。
    • Save」をクリックします。

これで、このファイルをAlexaで使用できるようになりました。

その他のツール

このトピックでは、オーディオコンテンツの標準化に使用できる多数のツールのうち2つのツールについて説明しました。さらに、コマンドラインツールでプロセスを自動化することもできます。たとえば、FFmpegloadnormフィルターはオーディオコンテンツのラウドネス調整に使用できます。

次の例では、FFmpegを使用してファイルのラウドネスを参照するコマンドを示します。

$ ffmpeg -i test.mp3 -af loudnorm=I=-14:TP=-3:LRA=11:print_format=json -f null -

このコマンドでは、次のように指定します。

  • loudnorm 音声フィルター: -af loudnorm
  • 統合ラウドネス-14: I=-14
  • トゥルーピーク値-3(-2のしきい値より低い): TP=-3
  • ラウドネス範囲11: LRA=11
  • 入力ファイル: test.mp3
  • 出力形式なし-f null -を指定(ラウドネスを変更する出力ファイルを指定)
  • JSONとしてのコンソール出力形式: print_format=json

loudnormフィルターに渡せるオプションの完全なリストについては、FFmpegのドキュメントを参照してください。