欧米の企業や研究機関が、新たな深層学習アルゴリズムを猛烈な勢いで開発している。より幅広い問題に適用できる方式の実現を狙い、脳の仕組みの模倣や「メタ学習」と呼ばれる手法の利用が活発だ。研究開発の最前線に位置する英DeepMind社と米OpenAIの研究例を紹介する。

 英DeepMind社を率いるDemis Hassabis氏を突き動かすのは、多彩な用途で活躍できる汎用の人工知能を開発するという信念だ。同社を一躍有名にしたビデオゲームをプレーするAIは、同一の学習アルゴリズムとDNNの構造で何十ものゲームをマスターした。トップ棋士を破った「AlphaGo」も、「基盤になった技術は汎用で、他の分野に幅広く適用し得る」1)、注1)とする。同社には汎用人工知能(AGI:Artificial General Intelligence)向けを想定した手法の論文もあるほどだ注2)

注1)同氏は、「特に、最適化できる明確な目的関数があり、取り巻く環境を正確にシミュレーションできて素早く実験できるもの」とのただし書きを付けている。「汎用」の意味は、「同じパラメーターを備える同一のシステムが、幅広い用途で高い性能を発揮すること」とする。汎用的な人工知能を開発する目的は「(気候変動やマクロ経済の問題、アルツハイマー病といった)人類だけでは手に負えない分野で、新たな知識を素早く獲得できるように助けること」という。
注2)「PathNet: Evolution Channels Gradient Descent in Super Neural Networks」(arXiv.orgの論文IDは1701.08734)がそれで、AGIの実現には、多くのユーザーが1つの巨大なニューラルネットワークに多数のタスクを学習させる方法が向くと指摘。既に学んだタスクを壊さずに新しいタスクを学習させるために、既存のネットワークから、再利用できる部分を見出すアルゴリズムを提案している。

 それでも人の知性が備える汎用性には、まだ遠く及ばない。新しい技能の獲得の素早さや、あらかじめ計画を立てて行動したり継続的に学習したりする能力などで、人に匹敵するAIは現在どこにもない(図1)注3)

図1 人に近い能力の獲得へ
図1 人に近い能力の獲得へ
現状の深層学習技術は人が持つ学習能力に遠く及ばない部分が多い。こうした弱点を補い、より高度なAIを実現するために、脳に似た動作をしたり、より深い知識を獲得したりできる学習アルゴリズムの研究開発が欧米の企業や研究機関を中心に活発だ。
[画像のクリックで拡大表示]
注3)囲碁などの限られた応用範囲では、AIの能力は既に人をはるかに超えている。DeepMind社が2017年10月に発表した「AlphaGo Zero」は、人の知識を全く使わず自己対戦から学習して、既存の「AlphaGo」を打ち負かした。ゼロから学習を始めて36時間後には、韓国のプロ棋士Lee Sedol氏に勝った「AlphaGo Lee」を上回るほど強くなったという2)。ただし、最終的には学習中に2900万回の自己対戦を実施しており、人と比べて効率がいいとは言えない。なお、2017年12月に発表したAlphaZero(1712.01815)は、同一のアルゴリズムで碁だけでなくチェスや将棋でも、学習開始後24時間以内に人を超える強さに到達したとする。

 より人に近い汎用性を目指して、DeepMind社をはじめとする多くの企業や研究機関が、新たなアイデアを我先に提案している。論文投稿サイトのarXiv.orgには、書き上げたばかりの査読前の論文が連日大量にアップされ、目ぼしいものはあっという間に世界中の研究者に共有される。学会発表が、ネットでの議論の追認になるほど、研究開発がスピードアップしているのだ。

 以下では、研究開発の最前線から、トップを競うDeepMind社と非営利研究団体の米OpenAIの研究事例を紹介する。