数週間分の解析を数分で

 「超ビッグデータ処理エンジン」プロジェクトでは、ストレージアクセス速度が1000万回/秒と、従来比10万倍の解析速度を備えるビッグデータ処理基盤を開発する。

東京大学の喜連川優氏
東京大学の喜連川優氏
[画像のクリックで拡大表示]

 ベースとなるのは、プロジェクトリーダーの東京大学の喜連川氏がかねて提唱し開発してきた、「非順序型」の実行原理を備える処理エンジンである。データの処理順序が決定論的(シーケンシャル)でなく非決定論的になる代わりに、データ処理速度を大幅に高められる特徴がある。これを基に、必要な時に必要な(データ処理)リソースを投入できるダイナミックなデータ処理環境を構築する狙いで、日立製作所と共同で開発を進めていく。

 同エンジンの医療分野への応用例として喜連川氏が挙げたのが、年間約16億件が発生し計400億レコードにも達するという保険レセプトデータの解析。その解析にはこれまで「2週間以上を要したが、我々の手法では数十秒~数分で答えが出る」(同氏)。これを通じ、例えば全国の医療の実態を「疾病別や地域別、デバイス(医療機器)別といった多様な観点から可視化できる。このように、さまざまなアングルからデータを料理できることが(今後の情報処理基盤では)重要だ」(同氏)。

 一方、「超ビッグデータ創出ドライバ」プロジェクトは、データの収集側を担う。数~数十kmにわたる範囲に存在する、数万台規模のモニター/センサーが生み出すビッグデータを収集するネットワーク基盤を開発する。「最大50kmを想定するカバレッジの広さが特徴」(プロジェクトリーダーの原田氏)だ。

 数kmエリアまでの「狭域系」ではWi-SUN(Wireless Smart Utility Network)方式、数十kmをカバーする「広域系」ではWi-RAN(Wireless Regional Area Network)方式の無線通信を採用する考えで、Bluetooth機器や携帯電話網といった既存のインフラとの共存も考慮したネットワークとする。「標準化を前提とし、誰もが簡単にインプリ/インストールできる形を目指す」(原田氏)。Wi-SUNは原田氏が提唱し、スマートメーターなどのインフラ系に採用されてきた方式である。狭域系の開発は京都大学とローム、広域系の開発は京都大学と日立国際電気が中心となって取り組む。