オーディオコンテンツのラウドネス値の正規化



オーディオコンテンツのラウドネス値の正規化

このトピックでは、Alexa音声と同じラウドネスレベルで再生されるようオーディオコンテンツを正規化する方法を説明します。

フラッシュブリーフィングフィードか別のカスタムスキルかにかかわらず、Alexaのオーディオコンテンツを作成する場合には、オーディオコンテンツがAlexaの音声と同じラウドネスレベルで再生されるようにすることが重要です。音声クリップは音声を変動させないように、一定レベルで再生する必要があります。テレビを見ているとき、コマーシャルの音量が他のコンテンツより大きいと気づいたことがあれば、ラウドネスレベルが一定でないと快適でないことが理解できると思います。音声クリップがガイドラインに従って一定レベルで再生されないと、認定に合格できません。

ラウドネスの要件

ラウドネスメーターと呼ばれるツールを使用して、音声のラウドネスを正規化します。ラウドネスメーターは、音声をラウドネス単位(LU)で測定します。ラウドネスメーターはピークメーターや波形メーターとは異なり、音声の電圧レベルを測定するのではなく、人間が耳で聞いた音をどのように感じるかを測定します。

ラウドネスユニットフルスケール(LUFS)とは、放送するオーディオコンテンツの正規化に特化して開発されたラウドネス規格であり、Alexaが再生する音声クリップに使用されます。Alexaには次のようなラウドネスガイドラインがあります。

  • プログラムのラウドネス値が平均-14 dB LUFS/LKFSであること。
  • トゥルーピーク値が-2 dBFS以下であること。

プログラムのラウドネスが以下の値の場合、スキルが却下されることがあります。

  • -19 dB LUFS未満である
  • -9dB LUFSを超えている
  • トゥルーピークのガイドラインを超えている

通常、ラウドネスはデジタルオーディオワークステーション(DAW)とLUFSメーターを使用して測定します。これらのツールを使い慣れている場合は、音声クリップを測定し、前述のガイドラインに合わせて調整します。これらのツールを使ったことがなければ、次の手順に従って音声クリップを評価し、必要に応じて変更します。

音声クリップのラウドネスの測定と調整

以下の手順では、無料のオーディオエディターおよびレコーダーであるAudacityと、Audacityのプラグインとして動作する無料のデジタルオーディオマルチチャンネルメーターであるdpMeter IIを使用します。使い慣れたツールがある場合はこの手順を実行する必要はありません。そのツールを使用して音声ファイルを標準化できます。それ以外の場合は、以下の作業が必要です。

ツールのダウンロードとインストール

  • 使用しているオペレーティングシステムにAudacityをダウンロードし、インストールする
  • 使用しているオペレーティングシステムにdpMeter IIをダウンロードし、インストールする

プラグインとしてのdpMeter IIの有効化

  • プラグインとしてdpMeter IIを有効にするには、EffectメニューでAdd/Remove Plug Ins..を選択します。
  • NewをクリックしてリストからdpMeter IIを検索します。EnableをクリックしてからOKをクリックします。
  • ここでEffectメニューが再度表示されるので、dpMeterII…を選択します。
Audacity Effectメニュー
  • dpMeter IIを起動したら、MODEに進んでEBU R128を選択してラウドネス単位をLUFSに変更します。これによってMODEの表示がEBUに変わります。
dpMeter II

ラウドネスの測定と調整

音声ファイルの再生に戻り、GAIN値を設定してラウドネスを調整します。最後にこのファイルを書き出します。

ファイルの再生

  • dpMeter IIでFile -> Openに進み、評価する音声ファイルの1つを検索します。
  • インターフェースの下部にある緑の矢印をクリックして再生を開始します。
  • 音声ファイルが短い場合はファイル全体を再生し、長いファイルの場合は、数回再生して音声をサンプリングし、全体のラウドネス範囲を想定します。これは音声ファイルの複数のポイントでIntegrated Loudness値を監視することで実行できます。ループ矢印をクリックするとラウドネス値をリセットできます。次の図でこれらを確認できます。

ラウドネスの調整

  • ラウドネスをどの程度調整すると、必要なプログラムのラウドネスを-14 LUFSにできるかを計算します。サンプルの音量が小さすぎる場合は、-14未満の数値が登録されています。サンプルの音量が大きすぎる場合は、値が-14以上になっています。
  • GAINボックスに計算した値を入力し、Applyをクリックします。たとえば、ラウドネス値の平均が-20.1の音声ファイルの場合、6.0のGAIN値を入力すると、値が-14.1になります。

音量は、音声ファイルのどのポイントでもちょうど-14 LUFSに調整することはできませんが、この値にできる限り近づけることが重要です。

新しいMP3としてファイルを保存する

  • ラウドネスを調整したファイルをMP3として書き出します。書き出すには、AudacityでFile -> Export Audioを選択します。

    • Nameにファイル名を入力します。
    • Save as TypeMP3を選択します。Audacityのこの機能をこれまでに使用していない場合、MP3エクスポートを有効にするためにLAMEをインストールするよう求められる場合があります。
    • QualityExtreme (220-260 kbps)を選択します。
    • Saveをクリックします。

これで、このファイルをAlexaで使用できるようになりました。

その他のツール

このトピックでは、オーディオコンテンツの標準化に使用できる多数のツールのうち2つのツールについて説明しました。さらに、コマンドラインツールでプロセスを自動化することもできます。たとえば、FFmpegloadnormフィルターはオーディオコンテンツのラウドネス調整に使用できます。

次の例では、FFmpegを使用してファイルのラウドネスを参照するコマンドを示します。

$ ffmpeg -i test.mp3 -af loudnorm=I=-14:TP=-3:LRA=11:print_format=json -f null -

このコマンドでは、次のように指定します。

  • loudnorm音声フィルター:-af loudnorm
  • 統合ラウドネス-14: I=-14
  • トゥルーピーク値-3(-2のしきい値より低い): TP=-3
  • ラウドネス範囲11: LRA=11
  • 入力ファイル:test.mp3
  • 出力形式なし-f null -を指定(ラウドネスを変更する出力ファイルを指定)
  • JSONとしてのコンソール出力形式:print_format=json

loudnormフィルターに渡せるオプションの完全なリストについては、FFmpegのドキュメントを参照してください。