米Melodis Corp. President兼CEO Keyvan Mohajer氏
米Melodis Corp. President兼CEO Keyvan Mohajer氏
[画像のクリックで拡大表示]
midomi.comのクライアント機能を組み込んだNokia社の携帯電話機「N80」。米Melodis社が試作したプログラムが組み込まれており,携帯電話機からmidomi.comにアクセスして楽曲検索ができる。Mohajer氏がMadonnaの「Like a Virgin」を口ずさんだ検索結果が表示されている。
midomi.comのクライアント機能を組み込んだNokia社の携帯電話機「N80」。米Melodis社が試作したプログラムが組み込まれており,携帯電話機からmidomi.comにアクセスして楽曲検索ができる。Mohajer氏がMadonnaの「Like a Virgin」を口ずさんだ検索結果が表示されている。
[画像のクリックで拡大表示]

 米Melodis Corp.は,ユーザーが歌った歌声や鼻歌,口笛から,目的の曲を探し出す「MARS(multimodal adaptive recognition system=複合適応認識システム)」と同社が呼ぶ検索技術を開発しているベンチャー企業である。同社はMARS検索を軸に据え,ユーザーがパソコンから吹き込んだ10秒程度の歌声から,目的の曲名を探し出すWWWサイト「midomi.com」の運営を2007年1月26日に始めた。

 来日した同社President兼CEO Keyvan Mohajer氏に話を聞いた。

――MARS検索のユニークな点は?

 従来の同種の検索技術とは異なり,メロディ(音程の変化),リズムやテンポ,息継ぎの場所,歌詞といったいろいろな特徴を曲の構成要素として総合的に分析するため,検索精度が高く,あいまいさに寛容な点です。従来の技術の多くは,どれか一つか二つの特徴を使ってマッチングさせる方式を取っているため,あいまいさに寛容ではなかったのです。

 MARS検索では,曲を検索したいユーザーは必ずしも歌が上手である必要はありません。音程やテンポ,キーが原曲からずれていても,歌詞がうろ覚えでも,データベースにその曲があれば探し出せます。検索対象となる曲のジャンルに得手不得手はありません。歌詞の言語も関係ない。

 曲の構成要素を分析する方法はいろいろありますが,我々の方式の特徴の一つは,音の波形(響き)から,歌詞が含まれるかどうかを判別したり,歌詞の言葉の響きを曲の判別に使う材料の一つにしたりしている点です。こうした処理を加えているので,言語の種類に関係なく,メロディが同じでも歌詞の異なる曲を判別できます。

 歌詞を認識している証拠をお見せしましょう。midomi.comでは同じメロディで,歌詞が異なる曲を区別して検索結果を返します。例えば,「Twinkle, twinkle, little star(きらきら星)」と「The ABC song(ABCの歌)」は同じメロディですが,どちらを歌ったかで検索結果は変わります。同じ歌詞の曲が登録されていれば、それが上位に来ます。別の歌詞の曲もメロディは合致するので、検索下位に表示されます。

 我々が会社を立ち上げてこの技術の開発を始めた2年前は,検索速度は現在の1万分の1でした。2年間かけて徐々に改良し,最適化することで現在の速度まで引き上げました。midomi.comのサービスではユーザーが音声を入れてから,ほんの数秒で検索結果を表示できます。

――曲の特徴の抽出方法がMARSの技術的な鍵なのか?

 我々の技術のユニークさは三つあると思います。まず,今説明した特徴の抽出方法。次に抽出した特徴情報同士を高速で照合する検索技術。三つ目は精度を引き上げるために,曲の種類などによってどういった特徴情報に重みをかけて検索するかを最適化する技術です。

 照合技術の難しさは,人の歌声同士の比較なので,どちらも完全には正しくないという点にあります。同じ曲でテンポやキーが異なったりすることがほとんど。そこで検索精度を上げるために,歌声から抽出した特徴情報にある種の変換をかけて,マッチングさせる必要が出てきます。

 我々はまず音楽に注力して始めましたが,この技術の応用範囲は広いと考えています。話し言葉やテキストの検索にも使えます。セキュリティ分野への応用も可能でしょう。テキスト検索への応用は例えば,演奏者名や曲名のスペルが間違っていても正しい検索結果を導き出すために,midomi.comでも使っています。

――楽曲のデータベースはどうやって構築しているのか?

 百科事典サイトの「Wikipedia」と同じ方式を取っています。つまりアクティブなユーザーがデータベースを作っていきます。原曲はデータとして登録していません。midomi.comのデータベースはユーザーによって作られるしくみになっています。

 midomi.com自体は200万曲を超える曲名や演奏者のデータベースを持っています。曲を登録したいユーザー(コントリビューター)はこの中から歌いたい曲を選び,自分で歌ってmidomi.comに登録します。これが曲データベースの元になります。ユーザーがmidomi.comでその曲を検索すると,コントリビューターが登録した歌声の一部を視聴できます。つまり,曲を検索したユーザーは,検索結果が正しいかどうかを確認するために,見知らぬだれかの歌声を聞くことになります。ここがミソです。

 midomi.comでは,歌声が気に入ったら,部分だけでなく全曲を試聴できたり,そのコントリビューターが歌った別の曲を聴けたりできます。気に入ったコントリビューターに投票してランキングしたり,だれかの歌についてユーザー同士が語り合うための掲示板なども設けています。つまりmidomi.comは単なる楽曲の検索サイトではなく,SNS(social networking service)としての側面も持っています。

 こうすることで,だれかに自分の歌声を聞かせたいと思っている人——実際,コントリビューターにはプロの音楽家や歌手志望の人がたくさんいます——が,コントリビューターになってくれるわけです。将来的にはmidomi.comで認められ,人気歌手になるといったことも起こるかもしれません。

――今後の展開は?

 midomi.comはまだ始めたばかりですが,この種のユーザー参加型のサイトとしては,特筆すべき成長を遂げています。特に強調したいのはコントリビューターの比率です。通常,Wikipediaのようなサイトでは通常,コントリビューターの割合は全ユーザーの1%前後と言われているのですが,midomi.comではその割合が10%近い。すでに日本語の歌を登録してくれているコントリビューターもいます。楽曲データベースを充実させるためにも,いろいろな国の人が参加しやすいように今後,サイトの国際化をぜひとも進めたいと考えています。

 midomi.comはサーバー側で検索を実行するので,携帯電話機などへの対応も簡単です。実際,フィンランドNokia Corp.携帯電話機「N80」にmidomi.comのクライアント機能を組み込んでみました。今後は携帯電話事業者などと組んで,サービスを展開することも考えたいですね。