自動音声認識(ASR)のテスト結果を改善する



自動音声認識(ASR)のテスト結果を改善する

自動音声認識(ASR)評価ツールを使うと、音声ファイルをバッチテストし、開発したスキルのASRの精度を測定できます。このツールの主なメリットは、評価レポートのフィードバックをもとにスキルのASRパフォーマンスを改善できる点です。レポートの結果をもとにサンプル発話を変更し、スキルの対話モデルと精度を改善します。

前提条件

ASR評価を実行するには、次のものが必要です。

  • Amazon開発者アカウント。必要に応じてdeveloper.amazon.comを参照し、アカウントを作成してください。
  • アノテーションセットに対してASRツールを実行し、生成された既存の評価レポート。評価レポートの生成方法については、自動音声認識(ASR)評価を実行するを参照してください。

ASR精度を改善するための推奨事項

評価結果をレビューして適切な文法ルールを適用し、スキルの対話モデルとASR精度の両方を改善します。アノテーションセットの発話を作成する際には、発話に次のガイドラインを組み込むようにしてください。

  • 同音異義語 – 同じ音で意味の異なる単語を正しく使用します。
  • 幅広い範囲を網羅したスキル内文法 – スキルに組み込んだ語彙や文法が広範であればあるほど、対話モデルと精度は改善します。

これらのガイドラインに加え、ASRの精度を高める2つの一般的な方法として、失敗した発話へのインテント値やスロット値のマッピングがあります。

インテント値やスロット値のマッピングにより精度を高める

精度を高める方法の1つは、インテントへの発話の追加です。

サンプル発話をインテントに追加するには

  1. 自動音声認識(ASR)評価を実行するに従って実行したASR評価に移動します。
  2. 失敗した発話のいずれかのアクション列で、マップボタンをクリックします。

    発話のマップ
    発話のマップ

    発話のマップ先プロンプトが開きます。

    発話のマップ先プロンプト
    発話のマップ先プロンプト
  3. 発話のマップ先プロンプトで、インテントタブ、スロットタブのいずれかをクリックしてマップ先を選択します。

    • インテントタブのインテントドロップダウンメニューからインテントを選択し、発話を追加ボタンをクリックします。
    • スロットタブのスロットタイプを選択し、発話の一部を新しい値、または既存の値の同音異義語として追加します。
  4. ページ上部のモデルをビルドボタンをクリックして更新した対話モデルをビルドします。

  5. 自動音声認識(ASR)評価を実行するの手順に従ってASR評価を再度実行し、結果が改善されたかどうかを確認します。