Alexa Skills Kit > 自動音声認識 (ASR)
ASR の登場以前、コンピューターにとって、話し言葉は単なる高低のある音声の録音にすぎませんでしたが、 ASR により、コンピューターは音の波形パターンを検出して、特定の言語の音と照合し、最終的にどの単語が話されたのかを特定できるようになりました。人とコンピューターとの他の対話方法と同じように、音声サービスも初めは基本的な機能だけで、ロボット化されたコールセンターのように、理解できる単語の限られたリスト(たとえば、「『はい』か『いいえ』で答えてください」など)を使うだけでしたが、
現在では飛躍的な成長を遂げています。人の話し方、特定の言語、アクセントでさえも理解できます。「うーん」という言葉をいくつか聞けば、つぶやきや独り言を言っているだけだと聞き分けることや、人に口答えをすることまでできるのです。
ASR が音声テクノロジーとの対話を実現する 3 つの方法を紹介します。
何十年もの間、ASR は静かに進歩を続けていました。外国語を学ぶ人のための教育や、音を聞き取りづらい人のためのアクセシビリティツール、ハンズフリーコンピューティングといった目的に使用されてきたのです。
今日、ASR は人とコンピューターとの会話を実現してくれます。タイマーを設定したり、試合の結果を確認したり、電話をかけたりするだけのために、マウスやキーボード、タッチスクリーン UI の使い方を覚える必要はありません。普段どおりに話しかけるだけでよいのです。
これにより、さまざまな可能性が広がります。さて、コンピューターが私たちの言葉を理解できるようになった今、次に何を教えられるでしょうか? 音声を使って、どんな魔法のような体験を作り出せるでしょうか? それは、これからの私たち次第です。
音声開発に ASR を利用するにはどうすればよいでしょうか。 Alexa Skills Kit (ASK)を使って画期的な音声エクスペリエンスを作成することから始めましょう。ASK を使うことで、Amazon が Alexa スキルの音声デザインの分野で培ってきた知識や草分け的な研究の成果を利用することができます。自然言語理解や音声認識のバックグラウンドがなくても、Alexa を使ったすばらしい音声エクスペリエンスを作成できます。ASK は、すばやく簡単に Alexa の開発ができる各種セルフサービスの API、ツール、ドキュメント、コードサンプルのコレクションです。
今すぐ音声開発を始めて、未来のユーザーエクスペリエンスを創造しましょう。