米InterSystems社は2016年10月27日、同社の自然言語解析技術「InterSystems iKnow」の日本語対応版「iKnow Japanese」の提供を開始した。同社のデータプラットフォーム「InterSystems Caché」の組み込み技術として提供する。同日、日本法人のインターシステムズジャパンが記者発表会を開催した。

記者発表会に登壇したInterSystems社 Product ManagerのBenjamin De Boe氏
記者発表会に登壇したInterSystems社 Product ManagerのBenjamin De Boe氏
[画像のクリックで拡大表示]

 iKnowは、文章(非構造化データ)を意味のあるデータ項目(構造化データ)に変換することをうたう自然言語解析技術。従来の日本語解析では、あらかじめ定義した辞書やオントロジー(階層構造)に基づき、意味を持つ最小単位に文章を分割する「形態素解析」を用いることが多かった。これに対しiKnowでは、辞書やオントロジーを基にトップダウンで文章を解析するのではなく、原文から意味のある一連のユニット(エンティティ)を見つけだすという、ボトムアップの手法で文章を解析する。

 例えば、「新しい再生医療として、歯髄細胞を使った治療法が注目されています」という文章を解析する場合、形態素解析では「新しい」「再生」「医療」といったように、意味を持つ最小単位に文章を分割する。この場合、原文の文脈情報は失われてしまい、各要素が原文において担っていた意味を正しく再現できない懸念がある。