【第1部：全体動向編】

AIの革命技術が実用に、「人間超え」はまだ遠く

進藤智則

2015.05.19

人工知能（AI）分野で数十年来の歴史を持つ技術「ニューラルネットワーク」が今、復権している。深い階層のニューラルネットを学習可能にする技術「ディープラーニング」が登場したことで、画像認識や音声認識などで従来手法と比べて高い精度を実現した。ただし現時点での応用範囲は限定的で人に近づくにはさらなる革新が必要だ。

　「人工知能に革命をもたらす」として一般の新聞や雑誌をもにぎわすようになった「ディープラーニング（deep learning、深層学習）」技術。その実用化が猛烈な勢いで進んでいる。米Google社 Senior FellowのJeff Dean氏は2015年3月に開催されたイベントで、同社の写真検索サービスや道路画像表示サービス「Street View」、Androidの音声認識、広告表示など「既に47種類の自社サービスで利用している」と明言した。

　Google社に限らず、米Microsoft社、米Facebook社など名だたる大手ネット企業が実用化に心血を注ぐ。Microsoft社はビデオ通話サービス「Skype」のリアルタイムの自動翻訳機能「Skype Translator」やストレージサービス「OneDrive」の文字認識（OCR）機能にディープラーニングを利用（図1）。米Clarifai社や米AlchemyAPI社のようにWebサイト上の画像に自動でタグ付けするサービスに活用するベンチャー企業も現れた^注1）。日本でもスマートニュースやABEJAといった気鋭のベンチャーが実サービスに応用し始めた（第2部：事例編「日本企業もDNN実用へ、人流分析やトピック分類に」参照）。

注1）AlchemyAPI社は2015年3月、米IBM社が買収した。IBM社の質問応答システム「Watson」にAlchemyAPI社の技術を統合していく計画である。

図1　成果を上げるディープラーニング

ディープラーニング技術がさまざまな分野で成果を出し始めている。（a）はMicrosoft社のビデオ通話サービス「Skype」が備える自動翻訳機能「Skype Translator」の画面例（英語・スペイン語間）、（b）はNVIDIA社による画像認識の実演例、（c）はコンピューターを使った一般物体認識のコンテスト「ILSVRC」での物体検出結果。