本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です
本記事はロボットとAI技術の専門誌『日経Robotics』のデジタル版です

 ロボットの音声会話機能を劇的に向上しうる技術が登場した。複数のユーザーが同時に発話した音声をマイク1本のみで計測し、ディープラーニング(深層学習)技術によって個別の話者ごとの音声に分離する技術を三菱電機が世界で初めて開発した。「Deep Clustering」という技術である1-2)。話者の声や言語の種類に依存しない技術であり、学習後はどのような複数話者の音声(不特定話者)でも分離できる。