Alexa Skills Kit    >    Alexaスキルを開発する際に知っておきたい用語

Alexaスキルを開発する際に知っておきたい用語

Alexa Skills Kit(ASK)を使って開発を始める前に、 よく使われる用語の意味を確認しておきましょう。

ほかの用語も確認するには

ASK用語の用語集(完全版)をご覧ください。

A

Alexaスキル(Alexa skill)

Alexaによって実行されるアクションやタスクのセットです。スキルはAlexa用のアプリのようなもので、ユーザーは音声を使って自然に日常のタスクを実行したり、コンテンツにアクセスすることができます。Alexaには、タイマーやアラームなどの機能が組み込まれています。Alexaスキルは、Alexa Skills Kitを使用して作成できます。スキルは、クラウドベースのサービスの形式のコードと、開発者コンソールで行うインターフェース設定の2つで構成されます。

Alexaデバイス(Alexa device)

Alexaサービスを利用できるデバイスです。Alexa Voice Serviceを使用するデバイスには、Amazon Echo、Amazon Echo Dot、Amazon Tap、Echo Showを始め、他社製のデバイスもあります。

Alexa Skills Kit

Alexaに新機能を追加するためのAPI、ツール、ドキュメントのコレクションです。Alexa Skills Kitによるスキルの作成を参照してください。

自動音声認識(ASR)(automatic speech recognition (ASR))

会話の音声をテキストに変換するテクノロジーです。ASRはAlexaのようなテクノロジーで、「アレクサ、今日の天気は?」といったユーザーの問いかけに答えられるようにする第一歩となります。

C

カスタムスキル(custom skill)

カスタム対話モデルを使用するスキルです。開発者は、スキルによって処理できるリクエスト(インテント)と、それらをリクエストするために呼びかけるフレーズ(サンプル発話)を定義します。インテントとサンプル発話のマッピングによって、対象スキルの対話モデルまたは音声ユーザーインターフェースが作成されます。

D

開発者コンソール(developer console)

Alexaスキルの作成、管理、公開に役立つインターフェースを提供する開発ツールです。

I

インテント(intents)

ユーザーの音声リクエストと完了するアクションを表します。インテントは、スロットと呼ばれる引数を持つことができます。スロットには可変情報が入ります。たとえば、「アレクサ、歴史マニアで6月3日に起こった出来事を教えて」 という文の場合、「6月3日に起こった出来事」が特定のAlexaスキルによる処理が可能なインテントにマッピングされます。これにより、このユーザーが「歴史マニア」スキルから特定の日付の歴史に関する情報を取得したがっていることを、Alexaに対して伝えます。

インテントの定義方法の詳細については、インテント、発話、スロットの作成を参照してください。

対話モデル(interaction model)

スキルに対して定義された一連のロジックパラメーターです。これにより、ユーザーがスキルと対話するための音声インターフェースが決まり、ユーザーの音声入力がクラウドベースのサービスで処理可能なインテントにマッピングされます。

呼び出し(invocation)

特定のAlexa機能との対話を開始するためのアクションです。たとえば、ユーザーが十二星座占いスキルを使うためにAlexaを起動する場合、「アレクサ、十二星座占いで今日の運勢を教えて」と言います。

Alexaは、その呼び出しに応答して「何座を占いますか?」とたずねます。

呼び出しには、フルインテント呼び出し部分インテント呼び出しインテントなしの呼び出しがあります。

N

自然言語理解(NLU)(natural language understanding)

コンピューターが音声を単なる言葉の羅列としてではなく、話す人の本当の意図として理解できるようにするテクノロジーです。たとえば、ユーザーが「アレクサ、今日の天気は?」と聞いたときに、NLUが周辺の天気予報について聞いているのだろうと推測できるようになるということです。

S

スロット(slot)

リクエストに関する追加情報をAlexaに提供するインテントの引数です。たとえば、「アレクサ、歴史マニアで6月3日に起こった出来事を教えて」 という文の場合、「6月3日」がリクエストを絞り込むデータスロット値となります。インテントによって、スロットが必須の場合もあれば、任意の場合もあります。スロットを必須に指定し、Alexaがそのスロット値を取得して会話を進めるようにするには、ダイアログモデルを作成してから、Alexaにそのダイアログをデリゲートします。

音声合成マークアップ言語(SSML)(Speech Synthesis Markup Language)

合成音声の生成用にテキストをマークアップする標準的な手段を提供するマークアップ言語です。Alexa Skills Kit(ASK)でサポートされているのは、SSML仕様で定義されているタグのサブセットです。

T

読み上げ機能(TTS)(text-to-speech)

テキスト文字列を合成音声(Alexa音声)に変換する機能です。Alexaサービスでは、プレーンテキストをTTSに変換できます。

U

発話(utterance)

ユーザーが行いたいことをAlexaに伝える、またはAlexaからの質問に答えるために言うフレーズです。カスタムスキルの場合、カスタム対話モデルの一部として、インテントにマッピングする一連のサンプル発話を指定します。スマートホームスキルの場合は、スマートホームスキルAPIのメッセージリファレンスにあらかじめ定義された発話が用意されています。

V

音声ユーザーインターフェース(VUI)(voice user interface)

人が声で呼びかけることでコンピューターやデバイスを操作する方法のことです。カスタムスキルの場合、音声インターフェースは、ユーザーの発話と、クラウドベースのサービスで処理可能なインテント間のマッピングで構成されます。対話モデルのスキーマを参照してください。

W

ウェイクワード(wake word)

ユーザーがAlexaに何かをリクエストする前に言うコマンドです。たとえば、「アレクサ、歴史マニアを開いて」と発話した場合には 「アレクサ」がウェイクワードになっています。Alexaユーザーは、定義されている一連のウェイクワード( 「アレクサ」、「アマゾン」、「エコー」、「コンピューター」)から選択できます。