9月に開かれたAlexaスキルアワードのファイナルステージに登壇したファイナリストの一人、杉崎信清さんは、筑波技術大学の3年生です。同大学は視覚・聴覚障害者向けの国立大学で、視覚障害(全盲)のある杉崎さんは情報システム学科で勉強しています。杉崎さんにAlexaスキル開発の経験や、VUI(音声ユーザーインターフェース)への思いなどを伺いました。
Q:情報システム分野に興味をもったきっかけは何ですか?
A:コンピューターは小学校5年のときから触っていましたが、ネットサーフィン程度でした。高校2年のときに、同じ障害のある友達がゲームを作っているのに触発されて、プログラミングの勉強を始めました。プログラミングをしていて面白いのは、できなかったことが自分の力でできるようになること。例えば、私はマウスが使えないので、プログラムを組むことによって、キーボード操作で実行できる代替機能を作成します。私が使いやすい、アクセシビリティが確保されたWebアプリケーションを作成することができます。
Q:難しい部分はどこでしょうか?
A:開発環境のビジュアル化が進んでいる点です。例えば、Visual Studioのような統合開発環境は、ドラッグアンドドロップで部品を配置できたり、関数名の先頭数文字を入力すると自動で補完するといった機能がありますが、私はその恩恵を受けることができません。そのため、部品を配置するコードや各関数名を覚えてベタ打ちする必要があります。これを楽しいと思えるか、面倒と思うかでプログラミングできるかできないかが変わるとは思いますが、自分としては楽しい。とはいっても、時間はかかります。
私はいつも、コマンドプロンプト、シンプルなテキストエディタ、ブラウザを使って開発しています。また、コマンドラインのSDKが提供されることはとても重要なことです。
Q:Alexaスキルとしては、「ハノイの塔トレーニング」を開発されていますね。開発体験はどうでしたか?
A:プログラミング自体は複雑ではなかったのですが、対話設計やコマンドプロンプトのSDKを使いこなすのに苦労しました。また、ビルトインインテントがキーボード操作で追加できなかったので、ローカルに書き出してベタ打ちし、それをデプロイしました。コンマ、スペース1個でデプロイに失敗するので、厳しい作業でした。また、デバッグには苦労しました。通常開発する際、スクリーンリーダを使って、音を聞いてコーディングしますが、スクリーンリーダは見えているすべてのものを読み上げてくれるわけではありません。この時は、開発者コンソールのテストシミュレータで出力されるJSONやエラーの内容をキーボード操作で確認できなかったため、エラーの内容がわからず、推測で直してデプロイという作業を繰り返しました。苦労はありましたが、これまでGUI開発にトライしたとき、デザインへの知識が足りずにマニュアルを読んでも理解できず壁を感じたことがあったのと比べると、VUIは開発がしやすいと思いました。アイコンの作成だけは、大学の先生にお願いしました。
Q:スクリーンリーダを使った開発の様子を詳しく教えていただけますか?
A:高速の読み上げを聞き取ります。今は2種類のスクリーンリーダを、普段用と開発用で使い分けています。普段用のものは、アルファベットを日本語発音で読むため、MとNなどが聞き分けづらいので、開発用はアルファベットをネイティブ発音で読み上げるものにしています。大文字と小文字、全角と半角は音の高低で区別します。読み上げと周囲の音を両方聞けるように、読み上げは耳をふさがない骨伝導のイヤフォンから聞き、同時に耳からは外の音を聞いています。プログラムは記憶します。ハノイの塔もだいたい覚えています。
Q:通常とても聞き取れない速さで読み上げていると思うのですが、どのように聞き取っているのでしょうか?
A:パソコンを使い始めた小学生の頃は、普通の会話程度の速さにしていましたが、これではとても健常者の読むスピードに追いつかないと気づき、少しずつ音声スピードを上げて慣れるようにしました。単位時間当たりの情報量を多くするためです。
Q:ハノイの塔のアイデアはどこから来ましたか?
A:プログラミング題材として有名だったことがきっかけです。スキルアワードの締め切りの時期は海外研修が入っていたりして忙しかったのと、スキル開発としても本格的なものは初めてだったため、まず作ってみようという感覚でした。ただ、ユーザーから、ゲームとして難しいという感想をいただいたことがあります。自分としては、円盤枚数3枚くらいであれば答えを記憶していますので、視覚を使わない普段の生活から来る差があったかもしれません。たとえば、エクセルの表を認識するとき、自分はセル一つ一つを確認し、覚えることで全体を把握します。記憶力としては自分は平均程度と思っていますが、必要なことは対応づけて覚えるということは日ごろからやっているので、この種のゲームはそれほど難しくない部分があります。
Q:次のスキル開発計画はありますか?
A:ゲームスキル開発に興味があるのですが、アドベンチャー系のゲームにはリアルタイム性が重要です。たとえば、ゲーム上で歩いていて何かにぶつかるとします。Alexaが「ぶつかりました、どうしますか?」と毎回聞いてくるようでは、時間がかかって面白くなくなってしまいます。視覚障害者用のゲームでは、左右の音のずれや音量で今いる位置情報を示したり、何かにぶつかると特殊効果音を出したりと、音で情報を知らせる工夫をすることで、プレーしていて面白いものがあります。どこを対話で表現するべきか、どうしたらもっと面白くなるかのアイデアを私自身も考えているところです。また、Alexaとの会話で起こりがちなまわりくどさは、ゲーム以外でも気になっています。さっき説明したのに・・・というような体験にならないような、シナリオ作りが大切だと思います。
Q:Alexaは普段使っていますか?
A:最初はAlexaに話しかけることに抵抗があり、特に家族のいる場所ではためらわれたのですが、最近は慣れてよく使っています。今使っているのはリマインダー、Googleカレンダーとの連携、音楽、ニュース、クックパッド、家族レーダー(家族の位置情報確認スキル)などです。便利ですね。
Q:Alexaは今後どのような方向に進展していくといいなと思っていますか?
A:Echo Spotなど画面対応デバイスが普及することで、画面情報に注目が行っている傾向があるかもしれませんが、画面だけに頼らず、VUIである意味はしっかり持てるようにした方が良いと思います。また、視覚障害者としても、カットしてほしくない部分です。
Q:将来の進路はどう考えていますか?
A:システムエンジニア系を目指したいと思っています。Webデザインではなく、データベースまわりやアクセシビリティ評価などの進路を今は考えています。ビジュアルを使わない音声対話設計は、私が得意な分野が生かせると思います。また、学校での授業を通して、基本情報技術者試験などの資格を取っています。点字の過去問が入手できないため、過去問を手に入れることだけを目的に何度も受験したという経緯もあります。普通の過去問と同様、手に入れられるようになるとうれしいですね。
Q:最後に、開発者のみなさんにメッセージがあればどうぞ。
A:一緒にVUIを盛り上げていきましょう!