News Center
「Microprocessor Forum 2007」リポート(その7)
マルチコアアーキテクチャで広いメモリー帯域とプログラミングの容易さを確保
[issued: 2007.05.29]
「Microprocessor Forum 2007」(米国サンノゼで開催)の最終日(5月23日)には、グラフィックス向けのマルチコアアーキテクチャをテーマとするセッションが行われた。アイピーフレックスに加え、米NVIDIA社、米Stream Processors社、米Stretch社の各社が最新プロセッサの情報を提供。いずれのプロセッサもローカルメモリーや共有メモリーなどによってメモリーアクセスの頻度を低減する仕組みが盛り込まれている。また、マルチプロセッサを対象としたプログラミングを行いやすくするために工夫が施されている。
C言語によるプログラミングに対応
写真1 NVIDIA社のJohn Nickolls氏
NVIDIA社のCUDAに対応したGPU(8シリーズ)の内部構造は図1のようになっている。全体で128個のSP(streaming processor)が集積されており、8個のSPが集まってSM(streaming muti processor)が構成される(図2)。チップ全体では16個のSMを備える。個々のSMは1.35GHz動作で32ギガFLOPSの演算能力を備え、768個のスレッドを取り扱うことができる。その結果、GPUとしては1万2288個のスレッドを取り扱うことが可能だ。
このようなマルチプロセッサにおいては、メモリー帯域が問題となる。そのため8個のSPを集めたSMには16Kバイトの共有メモリーを用意し、さらに2個のSMごとにテクスチャキャッシュを持たせることで、外部メモリーへ直接アクセスする負荷を低減するアーキテクチャとなっている。
また、Nickolls氏はCUDAのプログラミングモデルや実行方法についても解説を行った。それによると、CUDA対応のGPUでは、個々のスレッドをCPUから実行するのではなく、複数のスレッドをまとめてグリッドとし、そのグリッドごとにGPUでプログラムを実行する仕組みになっているのだという。それによって共有メモリーを活用して外部メモリーへのアクセス回数を抑え、またプロセッサ数にスケーラビリティを持たせることが可能になるという。
112ギガMAC/秒、16レーンのストリーミングプロセッサ
写真2 SPI社のBill Dally氏
Storm-1は16個のレーンと2つのMIPS系プロセッサで構成され(図3)、個々のレーンは、5個の32ビットALU(arithmetic logic unit)と4個のロード/ストアユニット、304個のレジスタ、256Kバイトのレジスタファイルなどを備える。また、2つのMIPS系プロセッサは、一方がLinuxなどのシステムOSとI/O制御の処理を担い、もう一方がストリーミングプロセッサとしてのプログラムの実行管理を担当する。
0.13μmのプロセス技術で製造され、700MHz動作で112ギガMAC/秒の演算能力を備える。
拡張命令に対応したコンフィギュラブルプロセッサ
写真3 Stretch社のRobert K. Beachler氏
Sponsor Links
TOP 10 ページ
- Micron社は“特売価格”でQimonda社を買収か?
- アナログスイッチ再入門
- ルネサス、中国での車載半導体シェア拡大に向けて サポート体制を拡充
- AndroidとTOPPERSを並行動作させる仮想化環境 ——『CEATEC JAPAN 2008』から
- SEMIがSEC/Nを買収、中古半導体製造装置市場も 包括サポートへ
- Transmeta社が身売りを計画、 Intel社からはIP売却などで9150万米ドルを取得
- 「出力段の電源電圧制御で、RFパワーアンプの 電力効率を3倍に高める」
- 「車内映像の無線伝送にはUWBが最適」 ——『ALPS SHOW 2008』から(その1)
- Sony Ericsson社、2000人の人員削減を開始
- オペアンプ選びの道しるべ
Partner Solutions
Event
-
ワイヤレステクノロジー・セミナー
『Wireless Technology for Home/Mobile Appliance』
2008年 10月01日ー2008年10月01日
ホテルグリーンタワー幕張 4F ロイヤルクレッセントE










