シニアエンジニアリングマネージャである及川卓也氏
シニアエンジニアリングマネージャである及川卓也氏
[画像のクリックで拡大表示]
ソフトウェア エンジニアの工藤拓氏
ソフトウェア エンジニアの工藤拓氏
[画像のクリックで拡大表示]

 グーグルが2009年12月3日に公開した「Google日本語入力」は,同社のネットブック向けOS「Chrome OS」に対応する――。同月7日に開催した記者説明会で,同社のシニアエンジニアリングマネージャである及川卓也氏が明言した。

 Google日本語入力は,統計モデルに基づく日本語変換エンジンを同社が独自に開発したもの。最大の特徴は,検索エンジンのために収集したWebに記述された情報を基に辞書データを作成した点。言わば,「現在のWebのありのままをデータ化している」(ソフトウェア エンジニアの工藤拓氏)という。このため他社製品に比べ,芸能人の名前や新語,専門用語などを比較的早期に収集できる。

 辞書の更新は「辞書データがバイナリ化されてプログラムに付随している」(工藤氏)ため,同社の更新サービス「Google Update」を通じて実施することになる。ただし更新頻度については「現時点では確定していない」。

 Web上のデータは「書かれた」データしか存在せず,本来読みの情報は入っていない。こうした情報は「さまざまな自然言語処理アルゴリズムを適用することによって抽出している」(工藤氏)。その際に,基盤となる辞書としてはオープンソースの「IPA辞書」などを用いている。このためすべての辞書情報をWeb上のデータから生成しているわけではなく,追加の語彙に対して読み情報を生成しているという。

 現在の対応OSは「Windows XP」「Windows Vista」「Windows 7」と「Mac OS X」。Linuxへの対応予定はないという。ただしChrome OSには対応し,「Chrome OSがオープンソース・ソフトウエアなので,Google日本語入力もオープンソースになるだろう」(及川氏)と説明した。