車載向け音声認識の大手、米Nuance Commnications が同社の最新技術を搭載するBMW社「5シリーズ」を使いメディア向けのデモンストレーションを都内で実施した。

図2  BMW東京ベイで、5シリーズ試乗会の模様
図2  BMW東京ベイで、5シリーズ試乗会の模様
[画像のクリックで拡大表示]

 BMWの車載インフォテイメントは、2015年7月に全面改良した「7シリーズ」からiDrive第5世代が最新型となっているが、その後の年次改良に伴い車載音声認識が最新版に書き換えられ、HMIの形状が違う5シリーズでも7シリーズと同じ最新版となっている。

 筆者は2016年3月、Nuance Communication 本社が米カリフォルニア州マウンテンビュー市内で実施した新技術説明会を取材している。その際、BMW 7シリーズを用いたNuance社の最新型音声認識を同車内で試したが、その日本語版が日本仕様の7シリーズと5シリーズに搭載されたのだ。

 Nuance社の最新型音声認識での最大の特徴は、車載器の本体、及び車載器を通信によってクラウドと連携する、同社がハイブリッドと呼ぶシステムを採用したことだ。

 音声を認識する上で、発話者の発話履歴を反映する、または文章の内容をより人間的に解釈する自然言語理解(NLU)を活用するが、車載器だけではNLUに対する演算の処理能力が不足して、音声を正しく認識しなかったり、または認識までの時間がかかる場合がある。これをクラウドでの解析を併用することで、音声認識の正確性と利便性を上げるのがハイブリッドシステムだ。

図1  BMWの専用アプリを使った車載器との連携を試す
図1  BMWの専用アプリを使った車載器との連携を試す
[画像のクリックで拡大表示]

 また、BMWに搭載された最新の音声認識システムでは、運転席と助手席のサンバイザーの手前の天井部分にマイクが装着されており、そこから音声を拾っている。運転車がステアリングにある音声認識ボタンを押して発話中に、助手席の乗員が話した場合、Nuance社の技術であるSpeech Signal Enhancement (SSE) によって助手席からの声をノイズとして捉えてキャンセルし、運転者の発話をより明確にすることで音声を認識しやすいようにしている。