前回まではCRAYシリーズ、正確にはCRI(Cray Research Inc.)とCCI(Cray Computer Inc.)の系譜を説明してきたが、こちらは基本的にベクトル型マシンであった。
命令フォーマットはSIMD(Single Instruction Multi Data)で、1つの命令で複数のデータに同じ処理を行なわせるというものである。
SIMDの場合、命令の解釈は最初の1回だけで、その後はひたすらデータの読み込み→実行→書き出しを行なうため、メモリーのロード・ストアさえ間に合えばピーク性能が出しやすい。
逆に言えば、このメモリーのロード・ストアが間に合わないと全然性能が出ないわけで、CRAY-3がお化けのようなメモリーシステムを実装したのも無理ないところだが、これは当然ながらコストアップにつながり、消費電力も凄まじいものになる。
Thinking Machines社のコネクションマシン「CM-1」。画像はComputer History Museumより
こうしたトレンドとはまた別の方向の研究も行なわれた。それはマルチプロセッサーの方向性である。1990年代にはMassively parallelなんて呼ばれ方をし、その後はGrid Computingという言い方に切り替わったが、中身はマルチプロセッサーである。
端的な話、今ではシングルコアのCPUなんてPCの世界でもごくわずかで、普通は2Pないし4Pのコアが搭載され、それを全部使い切ることでそれなりに快適なPC環境が実現できている。
同じように複数のCPUコアを用意し、それぞれに独自にプログラムを実行させればその分だけ性能が上がる。これをたくさん並べれば、その分だけ性能が上がるというわけだ。
もちろん話はそう簡単ではない。例えば全部のCPUでメモリーを共有すると、まず最初にメモリーがボトルネックになる。また、ある程度以上の個数のプロセッサーを接続しようとすると、今度はプロセッサー間の接続もボトルネックになる。
これはOSが密結合のマルチプロセッサーを前提としたものになっていることが最大の理由で、大規模なマルチプロセッサー構成は取りにくくなっている。
ただそうしたソフトウェアの互換性を無視すれば、例えばCPUとメモリーを一塊にして、その塊同士をネットワークでつなげば、ボトルネックは相対的に生じにくくなる。いわばPCクラスターをもっと小さい単位で実装するようなものである。もちろんこの場合でもネットワークをどう構築するかが最大の肝になる。
その大規模マルチプロセッサーに関する研究は特に80年代になってから盛んになった。そうした中でマサチューセッツ工科大学のWilliam Daniel Hillis博士が1981年9月に出した“The Connection Machine(Computer Architecture for the New Wave)”(関連リンク)というメモから始まったのが、今回紹介するThinking Machines社のコネクションマシンである。
並列コンピューティングを実現した
コネクションマシン
Hillis博士は当時MITのAI Labに属しており、その中で次世代のプロセッサーのあり方についていろいろな考察を行なっていた。このメモを見ていただければわかるが、メモそのものはプロセッサーのアーキテクチャーというよりは、もっと大きなMassive Parallelというシステムをどう構築すべきかについて論じたものである。
実はこれはHillis氏(まだ当時は修士)の博士論文の題材でもあるのだが、そこで博士号を取得するためにはメモの内容を実現する必要があった。
そこで氏はSheryl Handlerと共同でThinking Machines社を1983年に設立。ここで彼のメモの内容をCM-1(Connection Machine-1)として実装する。最終的にはこのCM-1に関する論文で氏は博士号を取得している。
→次のページヘ続く (6万5536個ものプロセッサーを並列処理させるCM-1)
この連載の記事
-
第815回
デジタル
3次キャッシュがスリムになっていたZen 5、ISSCCで公開された詳報 AMD CPUロードマップ -
第814回
PC
インテルがチップレット接続の標準化を画策、小さなチップレットを多数つなげて性能向上を目指す インテル CPUロードマップ -
第813回
PC
Granite Rapid-DことXeon 6 SoCを12製品発表、HCCとXCCの2種類が存在する インテル CPUロードマップ -
第812回
PC
2倍の帯域をほぼ同等の電力で実現するTSMCのHPC向け次世代SoIC IEDM 2024レポート -
第811回
PC
Panther Lakeを2025年後半、Nova Lakeを2026年に投入 インテル CPUロードマップ -
第810回
PC
2nmプロセスのN2がTSMCで今年量産開始 IEDM 2024レポート -
第809回
PC
銅配線をルテニウム配線に変えると抵抗を25%削減できる IEDM 2024レポート -
第808回
PC
酸化ハフニウム(HfO2)でフィンをカバーすると性能が改善、TMD半導体の実現に近づく IEDM 2024レポート -
第807回
PC
Core Ultra 200H/U/Sをあえて組み込み向けに投入するのはあの強敵に対抗するため インテル CPUロードマップ -
第806回
PC
トランジスタ最先端! RibbonFETに最適なゲート長とフィン厚が判明 IEDM 2024レポート -
第805回
PC
1万5000以上のチップレットを数分で構築する新技法SLTは従来比で100倍以上早い! IEDM 2024レポート - この連載の一覧へ