収録中に歌手が逃げ出す

 実現に向けた課題は技術面だけではなかった。音素の収録も一筋縄ではいかない。

 人間の歌声から音素を抽出するために,音素を取り出しやすい特殊なフレーズで歌ってもらう必要があった。このフレーズには取り立てて意味はなく,まるで「呪文」を唱えているかのようになる。歌声を合成するのに必要な音素を収集するまで,この呪文の収録は続く。必要な音素の数は言語の種類によって異なり,例えば英語で2500個,収録時間は英語で約3時間に及ぶ。退屈極まりない。「中にはギャラは要らないと収録中に怒り出し,帰ってしまう歌手もいた」(剣持)という。

 こうした苦労に耐え,2年間かけて課題を克服し,2002年,ようやくプロトタイプの開発にこぎ着けた。剣持と伊藤が出会ったのはちょうどこのころである。完成したのは2003年2月。VOCALOIDとして公式に発表した。

女の子のイラストを入れよう

 VOCALOID完成の知らせを聞き,クリプトン社はVOCALOIDを使った歌声合成ソフトの開発を具体化し始める。

 MEIKOや初音ミクの特徴の一つである「パッケージの女の子のイラスト」のアイデアはこの過程で生まれた。伊藤はこのソフトウエアが生み出す歌声のリアルさに自信を持っていた。「このクオリティーなら一般のユーザーも興味を持ってくれる。ならば『歌っている人格』をアピールした方がいい」。

ヤマハの「VOCALOID」を採用したクリプトン・フューチャー・メディアの「MEIKO」。2004年11月に発売された。

 伊藤の鶴の一声で,既に候補となっていた「マイク」のパッケージ・イラストは破棄され,ソフトウエアの名前として決まっていた「MEIKO」のイメージで,女の子のイラストを載せることにした。イラストは絵の得意な社員に描かせた。

 売れ行きを心配する周囲をよそに,2004年11月の発売前から「それなりに売れるだろう」という自信が伊藤にはあった。3度予測は的中し,大方の予想を裏切る累計4000本程度を売り上げた。この成功が,初音ミク誕生につながっていく。 =敬称略

―― 次回へ続く ――