[画像のクリックで拡大表示]

 産業技術総合研究所は,歌声合成ソフトウエアで必要な「合成パラメーター」の調整に向けたソフトウエア技術「VocaListener(略称:ぼかりす)」を開発した(発表資料)。同技術を採用することで,市販の歌声合成ソフトウエアを利用して,録音された歌唱事例データとその歌詞データを基に,声の高さや大きさといった歌い方をまねて自然な歌声を合成できる点を特徴とする。

 歌声を合成する場合,人間らしい歌声にするには,楽譜と歌詞を入力した後に,声の高さや大きさなどの詳細な時間変化を合成パラメーターとして調整する必要がある。従来では,この作業を人手で調整する必要があり,時間がかかっていた。VocaListenerの採用により,調整時間の短縮につながる。加えて,歌声の合成パラメーターの調整に関して知識を持たないユーザーでも,高品質な歌声合成が可能になるとする。

 高品質な歌声合成が可能になるのは,あたかも何度も発生練習を繰り返すように,合成した音声を再度取り込み分析し,パラメーターを補正して再度合成する処理を繰り返して歌い方をまねるためである。この技術により,歌声合成ソフトウエアや,その音源となる歌手の声を切り替えても容易に合成が可能になるという。

 加えて,いつどの歌詞を歌っているかを自動的に対応付ける技術により,楽譜データを入力しなくても歌詞に合わせて歌うだけでタイミングを調整できるという。タイミングがずれた場合もなるべく容易に訂正できる技術も開発した。

 今後は,産業界と連携して実用化し,音楽制作の支援や歌声合成が適用できる応用事例を開拓する考え。既にヤマハとともに実用化に向けた共同開発を進めている(ヤマハの発表資料)。その第一段階として,まずはVocaListenerの基本技術をネットワーク上のサーバーで動作させる「Netぼかりす」として試験的な運用を開始し,機能の拡張を順次進めてゆく予定だという。