音声対話機能を搭載するAI(人工知能)スピーカー(スマートスピーカー)が続々と登場するなかで、独自のコンセプトに基づく製品で再び注目を集めている企業がある。ロボット型携帯電話「RoBoHoN(ロボホン)」や、同社製スマートフォン(スマホ)に標準搭載する音声アシスタント「emopa(エモパー)」、調理家電「ヘルシオ」シリーズなどの「しゃべる機械」を開発しているシャープだ。これらの共通点は、ユーザーのことを知って学んでいく“相棒”のような存在であること。同社製品の設計思想や、人と機械とのコミュニケーションのあり方について、「ロボホンの母」こと景井美帆氏(シャープ IoT通信事業本部 コミュニケーションロボット事業統括部 市場開拓部長)と、エモパーの開発を手掛けた宇徳浩二氏(IoTクラウド事業部 プロダクトソリューション開発部長)に話を聞いた。

―― ロボホンとエモパーの一番大きな違いは何でしょうか。

ロボホンの開発を主導したシャープの景井美帆氏。
ロボホンの開発を主導したシャープの景井美帆氏。
[画像のクリックで拡大表示]

景井 対話機能の技術的なベースは同じですが、身体を持つロボホンと、スマホ搭載のエモパーとでは思想が違います。ロボホンは、身体の表現も含めてコミュニケーションできるので、例えば人に話しかけるときも、キョロキョロと辺りを見回して、人を(カメラで)見つけたら話しかける、ということを定期的にやっています。

 AIスピーカーには、(「OK Google」「Alexa」のような)「起動語を言う」というトリガーが必ずありますよね。一方でロボホンは、基本的にはずっと話を聞いている状態です。人が話すと発話の区間を検出して、その内容を認識し、「自分が話しかけられているのかどうか」を判断して返事をするという、割と高度なことをしています。もちろんトリガーがあった方が、音声認識的にはやりやすいですけれど。

宇徳 音声対話とひとことで言っても、コマンドで一問一答する形式や、何回か言葉のやり取りができるシステム、機器側からの通知形式のように、いろいろなやり方があります。

 結局、機械との音声対話、いわゆるボイスユーザーインターフェース(VUI)というのがまだまだ確立されていないんです。GUI(グラフィカルユーザーインターフェース)なら直感的に「ここを押せばいいのかな」と分かりますが、VUIだと難しいですよね。

2017年に日本での販売が始まったAIスピーカー。左から、Amazon.com社の「Amazon Echo」、Google社の「Google Home」、LINEの「Clova WAVE」。(画像:Amazon.com社、Google社、LINEの画像を基に作成)
2017年に日本での販売が始まったAIスピーカー。左から、Amazon.com社の「Amazon Echo」、Google社の「Google Home」、LINEの「Clova WAVE」。(画像:Amazon.com社、Google社、LINEの画像を基に作成)
[画像のクリックで拡大表示]