記者会見に出席した関係者。左から,マイクロソフト最高技術責任者の加治佐俊一氏,NVIDIA社VPで,日本法人代表のSteve Furney-Howe氏,東工大 教授の松岡氏,東工大・理事で副学長(研究担当)の伊澤達夫氏,日本ヒューレーット・パッカード 執行役員の山口浩直氏,NEC執行役員の丸山隆男氏。
記者会見に出席した関係者。左から,マイクロソフト最高技術責任者の加治佐俊一氏,NVIDIA社VPで,日本法人代表のSteve Furney-Howe氏,東工大 教授の松岡氏,東工大・理事で副学長(研究担当)の伊澤達夫氏,日本ヒューレーット・パッカード 執行役員の山口浩直氏,NEC執行役員の丸山隆男氏。
[画像のクリックで拡大表示]
TSUBAME2.0のノードの構成の概要。フラッシュ・メモリが含まれているのが特徴の一つ。
TSUBAME2.0のノードの構成の概要。フラッシュ・メモリが含まれているのが特徴の一つ。
[画像のクリックで拡大表示]

世界初の「SSDスパコン」?

 システム性能を高める上で東工大が工夫した点は大きく二つある。一つは,メモリ帯域幅の強化である。具体的には,ネットワーク・バイセクション・バンド幅(システムを任意の部分で二つに分断した断面の最小通信容量)が約200Tビット/秒で,東工大が2006年に構築したTSUBAME1.0の約33倍。メモリ帯域幅の合計が720Tバイト/秒で,同42倍となった。演算容量の拡大は同30倍で,メモリ帯域幅の伸びが目立つ。

 もう一つの工夫は,メモリとその構成にある。DDR3などDRAM系だけでなく,フラッシュ・メモリからなるSSD(solid state drive)を用いて,多段階ストレージを構成した点だ。基幹システムのDRAM系メモリの合計がマイクロプロセサ向けで80.6Tバイト,GPU向けで12.7Tバイトであるのに対し,SSDは173.9Tバイトと2倍近い。SSDは,データの入出力性能が高く,「(他のノードとデータを共有しない)ローカル・データの出し入れに用いることで,システム全体の性能向上が期待できる」(東工大の松岡氏)という。

消費電力が激減

 今回のシステムには,演算の性能以外にもう一つ注目すべき性能がある。消費電力の低さだ。TSUBAME1.0の消費電力が冷却システムを含めて0.85MWだったのに対し,30倍の演算容量を持つTSUBAME2.0ではわずか1MWで,単位演算容量当たりで約1/25に大幅削減した。消費電力1W当たりの(LINPACKでの)実行性能値は,1000MFLOPS/Wを超える見込みで,スーパーコンピュータの省エネルギー性能のランキング「Green500」でもトップを狙える水準だという。「GPUを多数用いたことに加えて,電源回りの効率を一般的な80%前後から94%に大幅に高めたり,密閉式の水冷システムを導入したことなどの改善が効いた」(松岡氏)。

 単位演算容量当たりの消費電力の大幅削減は,コスト削減の点でも大きい。全体の機器の調達費と4年間の基本的な運用費の合計は32億円。この額自体低い。スーパーコンピュータの一般的な導入コストが実行性能1TFLOPS当たり1000万円前後であるのに対し,TSUBAME2.0ではこの1/3以下となる同約300万円前後になる見通しである。実際にはこれとは別に,電気代年間約1億円などがかかる。仮に電気代が演算容量の向上分増えていれば,最大で年間25億円を電気代として支払うことになっていた。

 今回,東工大の松岡氏は,2014~2015年度に今回の後継機「TSUBAME3.0」を導入することを計画し,既に研究開発に着手していることも明らかにした。「目標とする性能は30PFLOPS前後だが,消費電力はTSUBAME2.0と同じかむしろ減らす計画」(松岡氏)であるという。