スパコンで機械学習を加速、NECがベクトル計算機技術

疎行列を含む演算を高速化

今井拓司

2017.08.21

NECは開発中の新型ベクトルプロセッサーを搭載したPCI Expressカードを2017年3月にドイツで開催した展示会「CeBIT 2017」で展示した

[画像のクリックで拡大表示]

　NECは、同社のベクトルプロセッサーを使って各種の機械学習の演算を高速化する技術を開発した。このプロセッサーを搭載する同社のスパコン「SX-ACE」に適用し、複数台のx86サーバー機で構成するクラスターで実行する場合と比較したところ、数十倍～1000倍以上の性能を達成（図1）。研究成果を2017年7月開催の国際会議「International Symposium on Parallel and Distributed Computing」で発表した。

図1 数十倍～1000倍以上高速に

NECは、開発した機械学習の高速化技術を同社のスパコン「SX-ACE」に実装し、ビッグデータ分析基盤「Spark（バージョン1.6.0）」を搭載した複数のサーバー機（クラスター）と性能を比較した。いずれもコア数は合計64で、前者はNECのベクトルプロセッサー、後者は米Intel社のマイクロプロセッサー「Xeon E5 2630v3」を搭載する。Web広告の最適化などに用いるロジスティック回帰（a）、レコメンデーションなどに使う特異値分解（b）、文書の分類などに利用するK-means（c）の3つで実行時間を比較した結果、新手法の方が67～1632倍高速だったという。（a）にはWeb上の広告配信技術を手掛けるフランスCriteo社の公開データセット、（b）と（c）には英文のWikipediaのデータ全文を用いた。（図：NEC）

[画像のクリックで拡大表示]

　注意が必要なのは、深層学習（ディープラーニング）は今回の技術の対象ではないことである。開発した技術は、データを行列で表現した時に要素の多くが0になる「疎行列」の演算向け。とりわけデータが「ロングテール」や「べき乗則」などと呼ばれる、裾野の長い分布に従うものを想定する。画像認識を中心に利用が広がる現在の深層学習は密行列の演算が中心で、この条件に当てはまらない。