Tech-On!は無料登録制の技術情報サイトです。ぜひ会員登録してこの記事の全文をお読みください。 Tech-On!無料登録の説明ページ初めてご利用の方:無料会員登録へ登録に関するご質問登録に関するご質問学生の方:無料会員登録へ ログイン・ページに進むIDやパスワードをお忘れの方は…Cookieが使えない状態になっていませんか?
お薦めトピック
- AD -

【ISSCC続報】米ベンチャーなど,512GOPSと高速動作のDSPを開発

2007/02/20 08:32
野澤 哲生=日経エレクトロニクス
はてなブックマーク
Facebookでシェアする
Twitterでつぶやく
印刷用ページ
ダイの写真とレイアウト。
ダイの写真とレイアウト。
[クリックすると拡大した画像が開きます]
ブロック図。DSPコアがデータのキャッシュへの入出力を制御する。
ブロック図。DSPコアがデータのキャッシュへの入出力を制御する。
[クリックすると拡大した画像が開きます]

 米Stream Processors,Inc.(SPI社)と米Stanford Universityは,8ビットの演算性能が512GOPS,16ビットで256GOPSと高速なDSP「Storm-1」シリーズを開発し,ISSCC 2007で報告した。SPI社は「FPGAと比べてプログラミングは柔軟だが演算性能が低かった既存のDSPの弱点を克服し,ASIC並みの性能を実現した」と主張する。現在,エンジニアリング・サンプル出荷中で,2007年第2四半期の量産を予定している。

 このDSPは,0.13μmルールのCMOS技術を用いて台湾TSMC社が委託製造した。トランジスタ数は3400万個。消費電力は8〜16W,標準10Wと小さい。電源電圧は1Vの場合の動作周波数は800MHzである。ただし,サンプル出荷中の製品は500MHzで動作させている。

 想定する用途は,動画の符号化やトランスコーディング,画像解析,無線基地局での信号処理など。例えば,H.264のベースライン・プロファイルを用いた1080p映像の符号化であれば,このDSP1個で30フレーム/秒での処理が可能という。

 Storm-1では,「データ並列」と呼ぶ並列演算方式で高速性能を実現した。具体的には,複数の命令を連結して一つにまとめたVLIW(very long instruction word)命令を,16レーンの並列演算ユニットに同報して実行する。各レーンには,それぞれ5個のALUがあり,VLIW命令に埋め込まれたSIMD演算を実行する。

 アーテキクチャ上のもう一つの特徴は,米MIPS Technologies,Inc.製のDSPコアが「LRF(lane register file)」と呼ぶキャッシュへデータのロードやストアを制御し,メモリ・アクセスのレイテンシをできるだけ隠ぺいする工夫を施している点である。「コンパイラがプログラムを解析してデータの細かな配置(allocation)を決める。これによってデータの待ち時間を最大でも2サイクルに抑えた」(同社)。

 こうしたアーキテクチャであるため「データに構造がある用途で威力を発揮する。逆に,一般的なデータベースの検索など,データ間のつながりが小さい用途には向かない」(同社)という。

 プログラミングにはC言語や/C++言語が利用可能。「単純な符号化処理だけでなく,そこから得たデータを画像認識に利用するようなこともできる」(SPI社)という。

イプロスの製品トピックス
とても参考になった 0
まあ参考になった 0
ならなかった 0
 投票総数:0
コメントに関する諸注意
(必ずお読みください)



コメントの掲載は編集部がマニュアルで行っておりますので、即時には反映されません。しばらくお待ちください。
記事中に誤りなど,編集部へのご連絡にはフッターのご意見/ご感想・お問い合わせをお使いください。
English
中文