日立製作所の基礎研究センタは、大量の日本語テキスト資料から経営判断に有効な部分を抜き出すための技術を開発した(ニュースリリース)。そのポイントを2016年6月2日に本社で開いた報道機関向け発表会で説明した。

以前に開発した「英語のテキスト資料から経営判断に有効な部分を抜き出す技術」の概要とその課題 日立のスライド。
以前に開発した「英語のテキスト資料から経営判断に有効な部分を抜き出す技術」の概要とその課題 日立のスライド。
[画像のクリックで拡大表示]
今回は、「注目箇所推定層」と呼ぶ新たな層を設けたニューラルネットで深層学習 日立のスライド。
今回は、「注目箇所推定層」と呼ぶ新たな層を設けたニューラルネットで深層学習 日立のスライド。
[画像のクリックで拡大表示]
学習フェーズ(左)と利用フェーズ(右) 日立のスライド。
学習フェーズ(左)と利用フェーズ(右) 日立のスライド。
[画像のクリックで拡大表示]

 同社は、大量の英語のテキスト資料から経営判断に有効な部分を抜き出す技術を2015年に発表している(日経テクノロジーオンライン関連記事1)。ある案件(議題)に対して、賛成の根拠になる部分と、反対の根拠になる部分とを抽出する技術である。その際に判断の視点(価値)も示す。この技術をコンピューターに実装する際には、処理に必要な英語特有のルールを人手でプログラミングしていたため、英語の文法に明るい人材が必要で、さらに開発に時間がかかったり、他の言語への展開が難しいという課題があった。

 今回、ディープラーニング技術を使って、これらの課題の解消を図った。具体的にはニューラルネットワークに、注目箇所推定層と呼ぶ新たな層を設けて、文章中で注目すべき語句を推定しながら学習するようにした。学習の際には、有効かどうかを人が教示する必要があるものの、対象言語の構造にはタッチしなくて済むため、言語に固有の文法に対する知識は不要で、任意の言語への展開も容易だという。さらに、プログラミングが要らないため、開発期間が短い。

 昨年発表の英語のテキスト資料を対象にした技術では、英語文法に明るい人が数カ月をかけてプログラミングしていたが、今回は文法に専門的な知識がない人(ただし、有効かどうかの判断はできる)が数週間で教示作業を行えるという。

 同社は今回の技術の詳細を、2016年6月6日~9日に北九州市で開催される人工知能学会全国大会にて発表する予定である。