【ISSCC続報】米ベンチャーなど,512GOPSと高速動作のDSPを開発
米Stream Processors,Inc.(SPI社)と米Stanford Universityは,8ビットの演算性能が512GOPS,16ビットで256GOPSと高速なDSP「Storm-1」シリーズを開発し,ISSCC 2007で報告した。SPI社は「FPGAと比べてプログラミングは柔軟だが演算性能が低かった既存のDSPの弱点を克服し,ASIC並みの性能を実現した」と主張する。現在,エンジニアリング・サンプル出荷中で,2007年第2四半期の量産を予定している。
このDSPは,0.13μmルールのCMOS技術を用いて台湾TSMC社が委託製造した。トランジスタ数は3400万個。消費電力は8〜16W,標準10Wと小さい。電源電圧は1Vの場合の動作周波数は800MHzである。ただし,サンプル出荷中の製品は500MHzで動作させている。
想定する用途は,動画の符号化やトランスコーディング,画像解析,無線基地局での信号処理など。例えば,H.264のベースライン・プロファイルを用いた1080p映像の符号化であれば,このDSP1個で30フレーム/秒での処理が可能という。
Storm-1では,「データ並列」と呼ぶ並列演算方式で高速性能を実現した。具体的には,複数の命令を連結して一つにまとめたVLIW(very long instruction word)命令を,16レーンの並列演算ユニットに同報して実行する。各レーンには,それぞれ5個のALUがあり,VLIW命令に埋め込まれたSIMD演算を実行する。
アーテキクチャ上のもう一つの特徴は,米MIPS Technologies,Inc.製のDSPコアが「LRF(lane register file)」と呼ぶキャッシュへデータのロードやストアを制御し,メモリ・アクセスのレイテンシをできるだけ隠ぺいする工夫を施している点である。「コンパイラがプログラムを解析してデータの細かな配置(allocation)を決める。これによってデータの待ち時間を最大でも2サイクルに抑えた」(同社)。
こうしたアーキテクチャであるため「データに構造がある用途で威力を発揮する。逆に,一般的なデータベースの検索など,データ間のつながりが小さい用途には向かない」(同社)という。
プログラミングにはC言語や/C++言語が利用可能。「単純な符号化処理だけでなく,そこから得たデータを画像認識に利用するようなこともできる」(SPI社)という。












