光吉 物理的には,音声信号の基本周波数やパワーなどをパラメータとして認識するのですが,それはテクニックでしかありません。重要なのは,そもそも「感情って何だろう」ということです。そんな抽象的なものを,いかにして数学や工学でモデル化するのかと。

[画像のクリックで拡大表示]

 技術者にたずねたら「感情は何グラムですか」と真顔でしかられてしまうかもしれない。認識対象がしっかりしていないと,モデル化できないわけですから。当然のことながら,開発当初は自分でもそう思いました。

 そこで「感情とは何か」を突き詰めた時に,カギはリズムだと思った。でも,音声については素人でしたから,つてをたどって大学の専門家に質問に行きました。その先生に素人なりの自分の考えを話したら,「それは面白い」と言われ,「音声についてイチから教えてあげよう」と。後で知ったのですが,音声研究の分野ではかなり著名な先生だったんです。

加藤 そこで得た知見を基に,音声の基本周波数の変化を感情に結び付けたわけですね。

光吉 そうです。先生に基礎から教えてもらう中で,自分が考えていた仮説が正しいと理論が後から付いてきました。音声で重要なパラメータである基本周波数は,喉の形状と関係が深い。では,発声の仕組みを調べようと,生理学や医学のアプローチからも研究しました。彫刻や建築を手掛ける私には,喉の構造がとてもシンプルに見えた。脳の情動,心臓の鼓動,声帯はシステムとしてつながっているんだと思いました。

博士号は必要ないでしょう?

加藤幹之氏
[画像のクリックで拡大表示]

光吉 情動が動けば心臓がどきどきします。それが声の基本周波数の変化につながる。心臓がどきどきすれば,冷や汗も出るし,声が固まる。それを自分でコントロールできたら,その人はヨガの達人か,天才詐欺師でしょう(笑)。ここに着目して,情動と音声の関係をモデル化していった結果として生まれた認識手法がSTです。開発には10年掛かりました。今もその改良を続けています。博士号も,この研究成果で徳島大学から取得したんです。

加藤 なぜ,博士号が必要だったのでしょう? 技術があれば,ビジネスとしては学位がなくても困らないのではないですか。

光吉 開発当初は「彫刻家が感情認識技術を開発できるわけがない」と,結構たたかれたんです。「信用できない。詐欺師だ」と,なかなか信じてもらえませんでした。そんな時,日本を代表する大企業に売り込みに行ったら,そこの研究者に言われたんです。「博士号を取ってきたら,話を聞いてやる」と。

 あまりにも悔しかったので,それなら取ってやると思いまして(笑)。学位を取った後に再度訪問したら「本当に取ったのか」と驚かれました。今では,仲良くしてもらっています。博士論文は,かなりインパクトがあったようで,日本機械学会が編集した『感覚・感情とロボット』(工業調査会)という書籍にも載せてもらいました。多くの先生との出会いといい,我ながら本当に運がいい人間だと思いますね。

(次回に続く)