米Amazon.com社の「Amazon Echo」、米Google社の「Google Home」、LINEの「Clova WAVE」・・・。AI(人工知能)による音声対話機能を搭載し、音声操作で音楽再生やショッピング、家電連携などができる「AIスピーカー」。「スマートスピーカー」とも呼ばれるこの製品群を、我々の生活におけるスマートフォン(スマホ)に代わる新プラットフォームとみる向きもある。しかし、これらがどれほどの知能を持ち、何ができるのかについては「謎」も多い。AIスピーカーは多くの可能性を秘めた“大型新人”なのか、それともハイプか。深層学習をはじめとするAIの技術開発やサービス提供を手掛けるUEI 代表取締役社長兼CEOの清水亮氏に話を聞いた。

―― 清水さんは今のAIスピーカーを、どんな存在だとみていますか。

UEI 代表取締役社長兼CEOの清水亮氏。
UEI 代表取締役社長兼CEOの清水亮氏。
[画像のクリックで拡大表示]

 結構面白いのは、今までパソコンを使わなかった人たちが、割と(当たり前に)使えているところかな。例えば、知り合いの漫画家さんの娘さんが「Google Home」に算数の宿題をやらせていたことです。「OK Google、5引く4は?」みたいなね。それから、スマートフォン(スマホ)をうまく使えないおばあちゃんがGoogle Homeに薬局までの行き方を聞いたりしてるという話も聞きましたね。

 僕自身は、スマートスピーカーが米Apple社の音声対話システム「Siri(シリ)」以上のことができるイメージをまだ持てていないんですが、1つ考えないといけないのは、スマートスピーカーとロボットとの棲み分けですよね。ロボットは、例えばシャープの「RoBoHoN(ロボホン)」とかは昔からスマートスピーカー的な使い方をされていますよね。RoBoHoNに毎朝天気を聞く人がいたりして。確かに僕もSiriに天気を聞きますけど、一番よく使うのはキッチンタイマーですね。ただ、しばらく使っていると、やっぱり普通のキッチンタイマーが便利だなって思ってしまうんです。声で指示するより、手でピってやった方が。

―― 確かに、言葉でいうより手で直接操作したほうが早いと思うことは多いですね。

 言葉はとにかく、情報が少なすぎるんです。Siriもそうですけど、1回言ったのに分かってくれなかった時の脱力感がすごい。カーナビの音声入力で、住所を言って聞き間違えられたときとか。これは人間でもそうで、例えば僕のオフィスに以前カキゾエさんとカキザワさんがいて、「カキZ」までは同じなので名前を呼ぶと両方振り向くわけです。それで、1人を下の名前で呼ぶことにしました。人間ならこれで良いですが、機械の場合は呼んでないのにしゃしゃり出てくると頭に来ますよ。

 でも、例えば「Amazon Echo」の場合は、(音声認識の)起動ワードは自由に決められないじゃないですか。そうすると、もし音楽が流れていてその歌詞に起動ワードみたいなのが含まれていて誤作動したら面倒ですよね。逆に「アレクサ、ピザ100枚~」みたいな歌詞の曲がYoutubeで流行るかもしれないけど(笑)。

左から、Amazon.com社の「Amazon Echo」、Google社の「Google Home」、LINEの「Clova WAVE」。(画像:Amazon.com社、Google社、LINEの画像を基に作成)
左から、Amazon.com社の「Amazon Echo」、Google社の「Google Home」、LINEの「Clova WAVE」。(画像:Amazon.com社、Google社、LINEの画像を基に作成)
[画像のクリックで拡大表示]