Simon Euringer氏は、BMWグループの次世代 BMWインテリジェント・パーソナル・アシスタント(IPA)のPrincipal Product Ownerであり、BMW、MINI、ロールス・ロイスの各自動車の音声体験を開発に取り組んできました。この役職に就く前は、米国カリフォルニア州マウンテンビューにあるBMWの研究開発拠点の責任者を務めていました。ここでは、業界をリードする専門家が協力し、BMWグループの車両の将来技術に関する外部視点を取り入れた研究と事前開発を行っています。
Euringer氏とBMW車との関わりは長いです。機械工学を専攻していた学生時代、彼は古い車を修理し、それを売って利益を得て大学の学費を賄っていました。当時の彼の愛車は緑色のBMW5シリーズ(「70年代に流行した色」)で、150ユーロで購入しました。
BMWは大規模言語モデル(LLM)を活用し、顧客が人との会話のように自然な車との対話を実現しました。本記事では、Euringer氏が語る、この技術が次世代の運転体験をどのように形作るのか、5つの重要なポイントをご紹介します。
Euringer氏は、LLMが車両内での顧客との対話をより自然で寛容なものにすると述べています。
「現在、顧客が指示を繰り返したり、特定の方法でクエリを表現したりして、望む動作をトリガーしなければならない場合があります」とEuringer氏は言い、「あるいは、電話をかけたい相手のフルネームを覚えていなければならないかもしれません」とも語っています。
Euringer氏によると、LLMは人の要求の文脈に対して感度が高く、 発話した意図を明確化する支援ができるとのことです。
Johnという同僚に電話をかけたいドライバーの例を考えてみましょう。彼女は電話をかけるために、Johnの苗字を思い出すのに苦労する必要はありません。Alexa LLMを搭載したBMWのアシスタントは、彼女が今朝会ったばかりのJohnと話したいのだと推測してくれるのです。
Euringer氏は、このような容易で文脈に応じた対話は、ドライバーの注意力の大部分を車の安全運転に集中させることが重要な自動車では不可欠であると述べています。
「高速道路を運転している時に、アクティブ・クルーズ・コントロールの最低速度や特定のライトが点灯した理由を知りたいと思った時、わざわざ車を停めて携帯電話や車のデジタルマニュアルで調べる必要はありません。運転している車について特別な訓練を蓄積しているLLMの出番です」
Euringer氏によれば、LLMによって、顧客は音声アシスタントとのやりとりを、以前と比べてはるかに簡単に行うことができるようになります。
「自動車に搭載されたLLMによって、顧客は以前は別々だった異なるドメインからの要求を組み合わせることができます。
例えば、今日の旅行計画と順路案内は、異なるドメインの別々のタスクです。
「Trip Advisorで、少なくとも4つ星を獲得しているビーガンレストランの近くにある充電ステーションへの行き方を教えて」というような顧客のリクエストは、3つの別々の情報源から情報を引き出す必要があります:a)充電ステーションのリスト、b)Trip Advisor上のレストランのリストと説明、c)選択した充電ステーションへのナビゲーション。
「運転中にこれらすべての情報源からすべての情報を引き出すのは不可能に近いか、まったく危険です」とEuringer氏。「しかし、LLMなら可能なだけでなく、とても簡単です。顧客は、一流のビーガンレストランの近くにある充電ステーションを探してほしいと頼むだけで、アシスタントが条件を満たす最寄りの充電ステーションを探し、案内してくれます」
Tobias Dengel氏は、著書「The Sound of the Future: The Coming Age of Voice Technology」で、あらゆる種類の情報が指先で得られてしまう情報過多の時代において、情報源が人間の脳が処理できる速度をはるかに上回って増加しているため、データで溢れた画面を目や手で操作するという発想がますます非現実的になっていると述べています。
Euringer氏は、顧客がコンバーチブルの屋根を走行中に開けられるかどうかを知りたい場合の例を挙げています。運転中に画面でこの情報を調べることはできません。しかし、LLMなら顧客がインテリジェントな音声アシスタントと対話して、タイムリーかつ関連性の高い方法で質問に答えることでこの問題を解決します。
BMWグループの音声アシスタント・エンジニアは、最先端の科学技術を活用して 誤った情報生成(ハルシネーション)の問題にも取り組んでいます。ハルシネーションとは、大規模な言語モデルがでっち上げの情報や単に無関係なデータを提供する現象を指します。LLMは、顧客が学習データセットに含まれていないクエリを尋ねたり、学習データセットに誤った情報が含まれていたりすると、ハルシネーションを生じさせることがあります。このような問題は、顧客がマーケティングコピーを考えたり、レシピを作ったりするような状況では許容できるでしょう。しかし、自動車に関連する文脈では、顧客が運転しているときに提供される情報が正確で、注意をそらす可能性がないことが重要です。
BMWの音声アシスタント・エンジニアは、RAG(Retrieval Augmented Generation:検索拡張生成)のような技術を使用して、特定の車載ニーズに対するハルシネーション問題を解決しています。RAGは、ユーザーマニュアルのようなソースからの正確で検証可能な事実のセットにモデルを根拠付けます。これにより、回答には常に正確性を担保することができ、信頼性を高めることができます。
多くの場合、顧客は単にその機能を知らないから使用していないだけかもしれません。LLMは、顧客の意図を認識し、積極的な提案を行うことで、この問題を解決することができます。
Euringer氏によると、LLMは、顧客が運転体験を向上させる新機能を継続的に発見できるようにすることができます。これらの機能は、ナビゲーション、コミュニケーション、エンターテインメントといった一般的な領域で、顧客の運転体験を向上させるのに役立つだけでなく、より安全なドライブの実現にも役立ちます。例えば、スクールゾーンにいる場合、音声アシスタントは積極的に速度を下げるよう顧客に促すことができます。
「LLMは顧客のコンテキストと意図の両方をより良く暗黙的に理解しています。これが、顧客が何と尋ねるべきかも知らなかった機能を発見する可能性を促進するのに役立つでしょう」 とEuringer氏は述べています。
BMWグループのすべてのチームにとって、顧客の安全が最も重要であるとEuringer氏は述べています。「LLMは、システムの状態をドライバーに積極的に知らせることができるため、より安全なドライブの実現に役立ちます」
「クルマのシステムが複雑化するにつれて、LLMは、クルマが自動運転モードになっているかどうかや、クルマがドライバーに代わって実行するアクションの内容など、重要な情報をユーザー・インターフェイスでドライバーに伝えるための新たなモダリティを提供することができます」
「BMWの使命は常に、お客様がハンドルから手を離さず、道路から目を離さないようにしながら、クラス最高の運転体験を提供することです。Alexaの各チームと開発したLLM対応のBMW音声アシスタントの研究段階のバージョンは、この未来を実現するための大きな飛躍です」
ご提供頂く個人情報は、 Amazon.co.jpプライバシー規約に従い取り扱われます。
BMWグループが、Amazonの車載用音声AI「Alexa Custom Assistant」を搭載する最初のOEMに
Amazonの車載用音声AI「Alexa Custom Assistant(ACA)」を採用したBMWグループは、新しいBMWの「Intelligent Personal Assistan(IPA)」に最先端の音声操作技術で運転体験を向上させ、自然で滑らかな対話を実現しました。