No results found
Yahoo!天気・災害、Yahoo!ニュース、知恵ラジオの3スキルを開発したヤフー株式会社の中村浩樹氏に、 スキル開発の過程や工夫した点、今後のボイスユーザーインターフェース(VUI)の可能性などを伺いました。
中村浩樹氏 IDサービス統括本部、スマートデバイス本部、IoTプラットフォーム サービスマネージャー
― Amazon Alexaを知ったきっかけを教えてください
米国のニュースでAmazon Echoがよく取り上げられていたのがきっかけだったと思います。昔から、自然言語のインターフェースでコンピューターを使うという取り組みには興味があったので、精度が上がれば実用化の時代がくると思っていました。ウェアラブルやスマートホームも手掛けてきましたので、将来性を感じていました。
― 会社としてAlexaスキルの開発はどのように決めましたか
私の所属するスマートデバイス本部は、モバイルの次の世代のデバイスやプラットフォームについて考え、サービス・モノづくりを行う部署です。もともとはパソコンをマウスで操作していたのが、タッチUIに変わり、それに加えて今、音声という新しいインターフェースがでてきた。つねに2歩3歩先を見て、新しいインターフェースに対応したサービスも手掛けてきましたので、Alexaというのも自然な流れでした。Echoのことは知っている人が多かったですし、みんな新しい物好きなので、総じて反応はポジティブでした。まずやってみる、という姿勢があると思います。
― Yahoo!天気・災害、Yahoo!ニュース、知恵ラジオという3つのスキルを開発されていますが、どのようにこの3つに絞りましたか
まずはシンプルなものからやろうという話になりました。インターフェースがまだ新しいので、複雑な内容だとユーザーに価値を伝えるのが難しいかもしれません。そこで、スマホやPCで既に体験できているものを、より便利にする、という意味で絞り込んでいきました。
― その中で、知恵袋はどのように表現しようという話がありましたか
もともとの企画では、音声で質問したものが投稿され、回答がついたら音声で回答が来る、という形でしたが、日本語の認識精度に課題があることが分かりました。そこで方針を変え、英国のAlexaでラジオがよく聞かれているという情報があったのを参考に、ラジオのように楽しめる内容を目指しました。カテゴリーもエンタメ的なものに絞っています。
― それぞれのスキルは、実際どのような使われ方をしていますか
やはりベーシックなものが使われています。利用者数は天気とニュースが多い。天気の中でも、今日の天気を聞くといったベーシックな使われ方が多いですね。いろいろと実験をしたいと思って最高気温や傘情報なども用意しましたが、結果的にはベーシックなものが使われることが分かりました。個人的には、より多くの人が必要としているものにこだわりたいので、今後もシンプルなものの使い勝手を高める方向で行きたいと思っています。
― 知恵袋についてはどう見ていますか
ユーザー数は天気やニュースほどではありませんが、経験値をためるという意味で得たものは大きいです。そうだろうと思って単に予想するのと、実際に経験するのは全然違います。新しい技術なので、やりたいことが100%できなかったというのも、大きな学びです。このことで、将来技術が追い付いてきたときに、自分のやりたいことがすぐにイメージできる状態になりました。次にこれができるようになったら、これをやろう、というのが具体的にイメージできるようになった意義は、大きいですね。
― それぞれのスキルの開発にはどれくらい時間がかかりましたか
どのスキルも実際の時間はそれほど変わりません。フローをゼロから書くのに1か月、テストに1~3か月。初めてだったのでこれくらいかかりましたが、今だったら半分の時間でできると思います。
― 苦労した点には何がありますか
Yahoo!天気・災害スキルで、地名の認識に苦労しました。ひたすらカスタムスロットに地名を登録していったり。また、Alexaとユーザーのやりとりが長くならないようにも工夫しました。たとえば「京都府の天気を教えて」と聞かれたら、京都府の代表地点の情報を答える。アプリであれば、地名を絞るドリルダウンができますが、音声で絞り込むのはユーザーに負担です。あと、中央区のように日本に多数ある地名(注:東京都、大阪市、札幌市、神戸市、さいたま市、千葉市等多数ある)だと、「中央区の天気を教えて」に対して、〇〇の中央区ですか、△△の中央区ですか、と候補地の選択肢が長く続いてしまうのは分かりづらい。4つ以上選択肢がある場合は、「詳しく指定してください」と返す、という仕組みも作りました。スマホと違い、1次元で時間軸しかない。絞り込みは工夫が必要です。
― ニュースはフラッシュブリーフィングとカスタムスキル両方で作っていますが、狙いは?
フラッシュブリーフィングは、ユーザーがスキルの使い方を学ぶ敷居が低いのでまずつくりましたが、将来的にはニュースもパーソナライズしたいので、カスタムスキルでもつくりました。
― ニュースの音源はどうしていますか
1日3回、アナウンサーに読んでもらっています。最初は機械読み上げという案もあり、やってみたところ、どうしても内容が分かりづらいという点と、ニュースは正確性が非常に重要なので、人名や地名の読み間違えなどがあってはいけないという点で、アナウンサーの録音を使うことになりました。将来的には、精度があがれば機械読み上げへの切り替えも検討していきたいですね。
― ニュースの聞きやすさで工夫したことはありますか
記事の区切りがわかりやすいようにジングル(音)を入れています。また、記事の長さは、スキルの公開後に「聞いていて長いと感じる」とのフィードバックがあったため、20~30秒にチューニングしました。
― スマホアプリの開発と違った点はありますか
知恵袋では、VUIを全部つくってから実際に開発に入ろうとしたら、音声認識の問題に直面しました。機能としてできること・できないこと、の情報は持っていましたが、「できる」の精度に段階があったのです。スマホでは、できるか・できないか、のどちらかだったのが、音声認識は0か1かのデジタルではなく「50%くらいできる」とかがある。今振り返ると、企画を全部作り込む前に、やってみながら進めた方が、早くできたかなと思います。
― できる・できないが0か1かでない中、どこをOKとするかという基準は持っていますか
いえ、まだありません。実際、開発していたころはEchoが日本に出る前だったので、ユーザーもいませんでした。米国では先行していましたが、文化も違いますし、日本のユーザーにどう受け入れられるかはふたを開けてみないと分からない。自分達が本当に使いたいものはどういうものかを自分に問いかけながら開発しました。
― VUIの魅力は何だと思いますか
音声なのでだれでも使え、ハードルが低い。たとえば、私の親はスマホが全く使えないのですが、声でしゃべるなら誰でも使えます。あと、スマホアプリだったら①スマホを取り出す②ロックを解除③アプリを立ち上げる、というステップがありますが、音声は何かをしながらでも、すぐに使えるところもいいと思います。だからこそ、答えもすぐに返ってくるように気を付ける必要があります。ただ、すべてのインターフェースが音声に移り変わるとは思っていません。音声でサマリーやヘッドラインを聞いて、スマホで詳細を見る、など、得意な部分を分け合う形になっていくと考えています。あとは、近くにあったらタッチ、離れていたら声、とか。人の会話と同じですね。会話で伝わらなかったら書いたりする。一番速い方法ですます、ということになると思います。
― 2月にYahoo!天気・災害スキルに通知を実装しましたね
通知はずっと注目していたので、日本でできるようになると聞いた瞬間、飛びつきました。通知があると、ユーザーが使い方を覚えなくていいからです。デバイスが光っていれば通知が来たと分かる。そして、ユーザーはすぐに必要な情報を得ることができます。
― アプリでもプッシュ通知がありますが、同じような考え方でしょうか
Alexaではスマホのプッシュ通知より情報を絞っています。たとえば、スマホでは天気自体を知らせますが、Alexaでは雨が降りそうな時しか知らせません。スマホでは、来た通知を見ないという選択肢もユーザーにはありますが、Alexaは音声で聞くまで内容がわからないので、本当に必要な情報でないと、がっかりさせてしまう。不必要なものを送ってしまうと使われなくなってしまうので、本当に必要なものから厳選して、少しずつ広げていきたいと考えています。
― 今後やっていきたいことは
スマホも含めた体験をつなげていきたいですね。ログインをしてもらい、音声に適したものは音声で届けて、続きはスマホで見る、という形。あとは、どういうデバイスが出てくるかにもよりますが、たとえばAlexaが車にも搭載されれば、ナビゲーションとか、モバイルイヤホンが出てくれば、カレンダーやメールとか。かちっと決めるというより、出てくるものに柔軟に対応していきたいです。
―VUIにも、もっと人が慣れていくと思いますか
はい、デバイスに向かって人と同じように会話をしていくようになると思います。今はまだVUIはボイスコマンドというイメージだとは思いますが、人の生活にAlexaがもっと自然に入ってくる世界がくるのではないかと思います。最近街でも、若い人が音声検索をしているのをよく見るようになりました。自分自身もスマートスピーカーを使うようになってからはデバイスに向かってしゃべることへの抵抗がなくなり、スマホでも音声アシスタントをよく使うようになっています。まだまだこれからですが、確実に主流になっていくと思います。
― 最後に、これから続く開発者へのアドバイスをお願いします
とにかくやってみよう、です。チャレンジすれば学びがあります。まだVUIは立ち上げの段階なので機能もシンプル。そうするとエンジニア1人でつくれてしまいます。開発はささっとできるし、コストも大きくない。まずはトライすることが重要です。大きなビジネスチャンスを狙うより、ちょっとしたところから始めるといろんな学びがあると思います。今は10年前のモバイルと同じ状況だと思っています。色んな企業がトライアンドエラーを繰り返す中で、ユーザーの生活を大きく変えるプロダクトが次々と出てきた。VUIでも同じだと思います。とにかくトライして、知見をためる。そうやっていくと、時代の動く瞬間に波に乗ることができるのではないかと思います。