AIスピーカーが登場したことで、音声のやり取りによる「音声インターフェース」が新たなUI(ユーザーインターフェース)としていよいよ定着するのではないかとの観測が出ている。一方で、技術的にまだ未成熟との指摘もある。果たしてAIスピーカーの“現在地”はどうなのか。各種機器のUI・UX(ユーザーエレクスペリエンス)を専門に手掛けるソフトディバイスを率いる同社 代表取締役の八田晃氏に聞いた。同氏は、この“米国発の新しいデバイス”を評価する前に、欧米と日本の文化や言語的な差異に目を向けたという。

ソフトディバイス 代表取締役の八田晃氏。
ソフトディバイス 代表取締役の八田晃氏。

 AIスピーカーに期待される最大の役割は、いわゆる「エージェント」だ。UIにおける意義としては、ユーザーによる直接操作から「依頼 − 代行型」にパラダイムが変化することを意味する。

 米Apple社は1988年に「Knowledge Navigater(ナレッジ ナビゲーター)」というコンセプトを発表した。このデバイスはノートパソコンのような形状で、中には対話型エージェントがいる。彼は大学教授に対して挨拶するのはもちろん、スケジュールの確認、断片的な情報からの論文特定や、「もっと新しいものを」という言葉で過去の閲覧履歴を踏まえた情報提示といった高度な論文検索ができる。加えて、論文中のデータ加工なども手掛けることができ、教授はさらに新しい発見ができる、というシナリオだった。教授とテレビ電話中の相手との会話を拾い、教授の「まだ先だ」という言葉を訂正する形でスケジュールの時刻を指摘したり、取り込み中にかかってきた電話にも応対する、相当“出来のいい”エージェントだ。

 エージェントに関しては欧米と日本で、受け入れられ方に異なる感覚があると思う。日本では身の回りのことで日常的に執事や助手、お手伝いさんなどを雇うケースが少なく、自分でほとんどやってしまう。もちろん、日本でも人を雇う層はいるがごく少数だ。一方、米国ではそういった層がもっと厚い。家事においてもハウスキーパーやガーデナー、ベビーシッターなど役割や範囲が多様で、仕事を切り出して人に依頼する、という文化が根付いている。日本人は依頼するという作法そのものに慣れていないのだ。

 あるいは、宗教観の違いなども影響するかもしれない。日本人の多くは、“物”に意思があると考え、時には洗濯機や冷蔵庫にも話しかけ、産業用ロボットに名前を付けたりする。何にでも魂が入っていると思う文化だ。それに対して欧米では、物は物であり、動かしたいと思ったら自分で動かすか、中間のエージェントに依頼すればいい、という文化だ。そういう文化圏で作られた物が日本に入って来たとき、日本人は魂を持つ物の1つとして話しかけること自体は受け入れると思うが、AIスピーカーだけが賢く他の物を取りまとめるという考え方は、むしろ窮屈に感じるかもしれない。

 トヨタ自動車の高級車ブランド「レクサス」にはオペレーターが対応してくれるサービス(「レクサスオーナーズデスク」)がある。カーナビの操作を遠隔でサポートしてくれたり、お店を紹介・予約してくれたり、当面のAIスピーカーの理想形を人力によって実現している。

 ただ、このサービスでは“相手が人間だ”と分かると、暇つぶしにコミュニケーション相手として使ってしまう人もいると聞いている。日本人は良くも悪くも線引きをしないというか、コミュニケーション相手としての機能を求めてしまう。西洋的なエージェントは「私の仕事はここまでです、それ以上は受けられません」というのが明確だ。その点であいまいな日本人にAIスピーカーがどう対応すべきか。これも気になるところだ。