前回はこちら

 前回までは脳とそのモデル化について解説しましたが、今回はやや趣向を変えて、ここ2~3年の最先端の研究と、 脳や汎用人工知能(AI)との関係を紹介します。

 ディープラーニング(深層学習)の研究で、ここ最近急激に発展した手法はGenerative Adversarial Network(GAN)でしょう。Ian Goodfellow(カナダUniversity of Montreal、現在はOpenAI所属)が2014年に提案した手法です。データを生成できる手法(生成モデル)の1つで、従来の方法より大幅に性能が向上したことで注目を集めました。

データを生み出す生成モデル

 GANを説明する前に、まず生成モデルとは何かについて触れておきましょう。従来、機械学習といえば教師あり学習がメインで(第13回参照)、かつ今まで見てきたアルゴリズムは基本的には何かを認識する手法でした。つまり、画像データを扱う目的は画像認識で、「この写真に写ってるものは何か?」とか「この顔は誰か?」などを認識します。テキストデータであれば、「この文章はポジティブな意見か?」とか「この文章は英語と日本語のどちらか?」といった特徴を認識あるいは分類する、というわけです。このあたりはおなじみですね。

 それでは、与えられたデータを認識・分類するのではなく、データ自体を機械が生成することはできるでしょうか?例えば、「鳥の画像」とコンピューターに指定したら、鳥の画像を描けるか?ということです。このような目的で利用できる機械学習アルゴリズムを生成モデルと呼びます注1)。ただし、本物と比べて遜色のないレベルの画像を生成するのは極めて難しい問題で、文字程度ならまだしも、写真やイラストのような複雑なものを生成するモデルには、これまで実用に堪えるものはありませんでした。

注1)ここでは「新しいデータを生成できる機械学習アルゴリズムが生成モデルである」といった書き方をしました。それはそれで間違いではありませんが、違う見方もあります。教師あり学習の手法を「識別モデル」と「生成モデル」に分類した場合、データを生成する確率分布を仮定して、学習データからその確率分布を推定するモデルのことを生成モデルと呼びます。

 これは問題の難しさを考えると無理もない話です。画像認識(クラス分類)などに使うアルゴリズムは識別モデルと呼ばれます。例えばSVM(Support Vector Machine)は識別モデルです。簡単に言えばデータを上手く分類するための平面を求める手法で、ある意味「与えられたデータを上手く分割できさえすればよい」わけです。これと比べると、1つ1つの本物らしいデータをつくりだす生成モデルは、必要以上に難しい問題を解いていると考えることもできます(最近はそうでもなさそうだという研究もありますが)。

 ただし、脳の機能の再現を考えると、生成モデルは不可欠の存在です。脳は「外の世界はどうなっているのか?」というモデルを内部に持ち、そのモデルの中で動くことで、高い予測能力を実現し、フレーム問題を回避していると考えられています。複雑な世界を脳という限られたリソースでなるべく効率よくモデル化することが求められるわけです。その場合に利用できるのが生成モデルです。場合に応じてモデルを生成できるようにしておけば、大規模なリソースを使わずに済むわけです。

 この意味で生成モデルは、脳の再現を目指す汎用AIと非常に相性が良い概念といえます。例えば、脳の情報処理原理の解明状況に関する資料や、人工意識の開発を進めるアラヤのCEOインタビューなどでも、外界について認識や予測を行うための生成モデルを持つことの重要性が語られています。