ディープラーニングの存在意義と注意点

 つまり、ディープラーニングを分かりやすく言えばこうです。人間では判別式が作れないような非常に膨大で曖昧なデータに対し、グループ分けなどを行う「数式」を作る手法がディープラーニングである、と。こうした特性を生かし、画像や音のような情報量が多い周波数データなどを処理することが非常に得意です。

 この点を踏まえると、いろいろなアイデアが浮かんできます。例えば、顔認識では、顔の位置を判別するだけではなく、性別や年齢、血液型まで判定できるかもしれません。私たちの持つ「常識」では、血液型がA型とB型の人の違いなどないように思えます。でも、100万人を分析すれば、何か特徴を見いだせるかもしれません。そして、その特徴は1箇所だけではなく、100箇所くらいの総合点で判別するものかもしれません。

 声についても同じことが言えます。また、1億人のレントゲン写真を判定すれば、5年後にどのような病気になるのかを予測できるかもしれません。実際にそうした研究が、さまざまな研究機関で行われています。

 AlphaGoは非常に複雑な内容になっています。囲碁を例に挙げると、細かい所は置いておきますが、黒と白の石がどのような配置になっていると勝てそうかというのを膨大なデータから判断しています。

 ディープラーニングは、あくまでも計算を行うアルゴリズムです。どのようなシーンで利用できるのか、どのデータを分析し、どのような結果を出すことに期待するのかを決めるのは人間です。私はほとんどの分野で使えると考えています。でも、実際に判別できるか否かは、やってみないと分かりません。それがディープラーニングなのです。

ディープラーニングの問題点

 ここで、1つ問題があります。ディープラーニングで分析し、それなりの結果を出すには学習データが必要です。学習データは多いほど高い精度が期待できます。しかし、データを集めるには、かなりの時間と労力が要ります。

 実際、Google社は猫と人間の画像を学習データとして集めるために、Webページの画像だけではなく、動画共有サービス「YouTube」などから収集しています。AlphaGoに関しても、これまでの棋譜を入力すると同時に、人工知能同士を仮想世界で対戦させた膨大な棋譜を学習しています(なお、これを強化学習と呼びます)。

 まとめると、次のようになります。

・さまざまな分野やさまざまなシーンで、これまで不可能だった新しい価値を生み出す可能性がある。
・学習を行う必要があるため、高い精度を出すには時間がかかる。
・学習を行うためのデータを集める必要がある。

 これらを踏まえると、ディープラーニングを利用するときに学習データを集めたのでは、リリースが大幅に遅れることになります。従って、ある程度目的が決まれば、実際にプロトタイプを動かしながら、学習データを集めて徐々に精度を高めていくというプロセスにする必要があります。

 つまり、これまで何度も私が言ってきた通り、「いつから始めるのが最善か」という質問に対しては、「今から」ということになるのです。