1840年代後半、米国では、ゴールドラッシュの熱の中、大勢の人々が一攫千金を夢見て西部に向かった。

 ゴールドラッシュは、運良く金を採掘できた人々の懐を温めただけでなく、周辺ビジネスも広げた。金を堀る道具を売る人、荷馬車の幌を売る人、宿を提供する人、鉄道を作る人…。金を掘る人々をターゲットに多くのビジネスが花開いたのだ。

 荷馬車の幌やテントの販売から身を立てて後に世界的なジーンズメーカー「リーバイス」の創業者となるリーバイ・ストラウスや、採掘者向けの送金サービスなどを足がかりに銀行やアメリカン・エキスプレスを創業したヘンリー・ウェルズとウィリアム・ファーゴらは、今や伝説的ですらある。もちろん、すべての人々が成功したわけではなく、ほとんどが夢破れたわけだが、ゴールドラッシュをキッカケに事業を広げ、歴史に名を刻んだ企業は少なくない。

 実は今、インターネットの世界で、新たなゴールドラッシュが始まりつつある。「ソーシャル・データ・マイニング」という技術分野がそれだ。

大量のデータから金鉱脈を見つける

 「マイニング」は、英語で「(鉱石を)掘ること」を指す。多くのネット企業が“金”の代わりに採掘しようとしているお宝が「ソーシャル・データ」である。

 ソーシャルとは「社会的な、社会の」といった意味だが、ネットの世界では「大衆」や「多くのネット・ユーザー」という意味合いで使われる。大衆がネット上に公開したブログや日記、写真などのデータが、ソーシャル・データである。ソーシャル・データ・マイニングは、大衆がネット上に残した大量のデータの中から、価値のある情報を発見しようとする試みだ。

 前回、このコラムで紹介した衆院選の得票率予測「クチコミ@総選挙」は、その取り組みの一例である(前回のコラムはこちら)。私が社長を務めるホットリンクと東京大学の松尾豊准教授らのグループとの共同プロジェクトで、ブログに投稿された立候補者についての口コミ情報から選挙結果を予測する取り組みだ。

 結果は、全300選挙区のうち241選挙区の当選者を的中させ、予測的中率は80.4%という高い結果だった。投票前の朝日新聞の電話による20万人規模を対象にした2回の世論調査との比較では、それぞれ94%と92%の一致率となった。この規模の世論調査では、1回の調査に数億円の費用が掛かるといわれている。口コミによる予測は必要なコストと,調査のスピードを考えると、活用の広がりに大きな期待が持てる。