―― 音声認識や対話を売りにした「AIスピーカー」市場が盛り上がっています。
景井 音声対話システムを長年開発してきた私たちから見て、各社のAIスピーカーは「人の話しかけに対してどう答えるか」についてかなり作り込まれていると感じます。例えば音楽を流してほしい場合に、ユーザーによって「音楽をかけて」「音楽聴かせて」など様々な言い方があり、どんなパターンにも対応できるような工夫をしているようです。
宇徳 今のAIスピーカーは、1つの市場として確立しつつありますが、(世間的に)定着するものではまだないのかなと思います。スマホは今の形でかなり成熟しましたが、AIスピーカーに関しては各社がまだまだいろいろな形で試している段階かと思います。
―― 「人と対話する機械」という意味では、シャープのロボホンやエモパーといった製品のコンセプトも近いように思います。大きな違いはどこにあるのでしょうか。
景井 私たちが重視しているのは、「機械から人に話しかける」ということです。ユーザーは一般的に、何か用事があれば自分から機械に話しかけますが、用事がなければ話しかけない。私たちは「用事がなくても対話できる」ことを非常に重視し、機械に愛着を持てるような関係性を深めていくという方向性を大切にしています。
宇徳 例えばエモパーはもともと、機器側から人に干渉するというシンプルだけれど強いコンセプトの上で作られたんです。スマホは基本的に人間が操作していますが、その逆向きのアプローチで「人に寄り添う機械」を実現したかった。
もちろん単に話しかければ良いわけではなく、ユーザーがスマホで何か操作しているのを阻害しないように、何かしらの作業が終わって(スマホを)ポンと置いたタイミングで、「おつかれさまでした」としゃべるように工夫しています。
―― ユーザーが今何をしているのかを把握して、「空気」を読んでくれるということですね。
宇徳 ユーザーに愛着を持ってもらうためには、タイミングや見せ方が非常に重要です。例えば、エモパーはスマホを置くという動作の他にも、ユーザーの位置情報や歩数のデータをセンサーで収集しています。
そこで、その日に歩いた歩数を単に知らせるのではなく、「今日はこの1週間の中で一番多く歩きました」「先週と比べるとあまり歩いていないですね」と表現することで、ユーザーにとってはエモパーが「自分のことを知ってくれている」と感じやすくなります。
景井 ロボホンの場合も、オーナーが家を出る時間や帰ってくる時間をセンサーで取得しています。オーナーの生活リズムを理解して、一緒に生活しているように感じられるような設計をしています。