「次は連載でなにやりましょう?」「プロセスルールの話でナノやマイクロといった小さい数字が続いたので、今度は大きな数字の話がいいです」「(なんだそれ)大きい、というとスパコンとかですかね」「あ、それいいですね、やりましょう」
……という、担当編集氏との白熱した議論の結果、今回からスーパーコンピューターの系譜について説明していく。今回は0回目というか系譜の事前準備という形で、スーパーコンピューターそのものに触れていきたい。
スーパーコンピューターの代表作
CRAY-1
そもそもこの手の話をする場合、スーパーコンピューターってなに? という問題が常に付きまとう。例えばスーパーコンピューターの代表例として名高い「CRAY-1」であるが、性能はどの程度かというと80MHz駆動で160MFLOPSとなっている。
CRAY-1もいろいろ派生型があって性能もまちまちなのだが、ここではCRAY Historyに出てきた数字を利用している。
この160MFLOPS(1秒間に1億6000万回の浮動小数点演算が行なえる)という性能であるが、実はARMの「Cortex-M4」というMCUコアに、オプションで用意されるFPUのスループットが1MFLOPS/MHz(ただし単精度のみ)であり、160MHz駆動のCortex-M4Fマイコンとほぼ同程度の性能ということになる。
NXPは最大204MHz駆動のLPC4300シリーズを昨年ラインナップしており、これにもFPUが搭載されているから、ピーク性能は確実にCRAY-1を抜いている。
もう少し一般的なところでは、2008年にインテルからネットブック向けプロセッサーとして発売された「Atom N270」のFPU性能は2.1GFLOPSに達するといった性能評価もあるほどで、今からすればCRAY-1の性能はそこらへんのマイコン程度でしかない、ということになる。
もちろんこの評価は公平ではない。CRAY-1がリリースされたのは1976年で、Cortex-M4やAtom N270がリリースされるまでに30年以上の時間が経過しているわけで、この時期を無視して議論するのはフェアではない。
では逆にCRAY-1が登場した1976年はどんなプロセッサーがあったのだろうか。インテルが8085をリリースしたばかりの頃である。8085は8080の後継品で、動作周波数はこの当時は3MHzどまりでなかったかと記憶している。
整数演算性能は3MIPSという計算になるが、FPUは搭載しておらず、外付けでも存在しないので、どうしても浮動小数点演算を行なおうとするとソフトウェアでのエミュレーションとなる。この当時に8085で浮動小数点演算をエミュレーションでやらせた場合の性能は探したが見つからなかった。
ただ一般にFPUをALU(整数演算ユニット)でエミュレーションすると50~1000倍程度時間がかかる(これはなにと比較するかによってばらつきが大きい)から、とりあえず100倍とすると、8085の性能はおそらく0.03MFLOPSほどになる。CRAY-1と比較すると5000倍以上の性能差になるわけだ。
マイコンではなくメインフレームではどうかというと、翌年の1977年にIBMは「IBM 3033」と呼ばれるプロセッサーをリリースしている。System/370として知られる、仮想記憶を実装したシステム向けのハイエンドプロセッサーで、IBMでは“The Big One”と呼んでいた(関連リンク)。
これがどの程度の速度かというと、これまた資料が乏しいのだが、こちらの表を見ると、1973年にラインナップされているIBM370/158がmy MIPS換算で0.64、LINPACKの速度が0.23MFLOPSとされている。1978年のIBM3033では、my MIPS換算が2.37となっており、ここから計算するとLINPACKの性能はおおよそ0.85MFLOPS程度と推定される。
一方前述の表には、CRAY-1の結果も1978年に入っており、こちらは堂々12MFLOPSである。IBMの3033の価格は360万ドル(当時のドル/円の為替レートは268円前後だったので、日本円にすると約10億円相当)で、一方CRAY-1は800万ドル(同じく21億4000万円相当)とさらに高価ではあったが、10倍以上の性能差に対して価格差は2.5倍だから、ずいぶん「お安い」買い物だったという考え方もできる。
→次のページヘ続く (Pentium 4を5120台並べれば地球シミュレータを抜けるか?)
※編注:記事の内容についての指摘をいくつか受けていますが、その点に関しては次回更新分(連載273回)で補足いたします。
この連載の記事
-
第802回
PC
16年間に渡り不可欠な存在であったISA Bus 消え去ったI/F史 -
第801回
PC
光インターコネクトで信号伝送の高速化を狙うインテル Hot Chips 2024で注目を浴びたオモシロCPU -
第800回
PC
プロセッサーから直接イーサネット信号を出せるBroadcomのCPO Hot Chips 2024で注目を浴びたオモシロCPU -
第799回
PC
世界最速に躍り出たスパコンEl Capitanはどうやって性能を改善したのか? 周波数は変えずにあるものを落とす -
第798回
PC
日本が開発したAIプロセッサーMN-Core 2 Hot Chips 2024で注目を浴びたオモシロCPU -
第797回
PC
わずか2年で完成させた韓国FuriosaAIのAIアクセラレーターRNGD Hot Chips 2024で注目を浴びたオモシロCPU -
第796回
PC
Metaが自社開発したAI推論用アクセラレーターMTIA v2 Hot Chips 2024で注目を浴びたオモシロCPU -
第795回
デジタル
AI性能を引き上げるInstinct MI325XとPensando Salina 400/Pollara 400がサーバーにインパクトをもたらす AMD CPUロードマップ -
第794回
デジタル
第5世代EPYCはMRDIMMをサポートしている? AMD CPUロードマップ -
第793回
PC
5nmの限界に早くもたどり着いてしまったWSE-3 Hot Chips 2024で注目を浴びたオモシロCPU -
第792回
PC
大型言語モデルに全振りしたSambaNovaのAIプロセッサーSC40L Hot Chips 2024で注目を浴びたオモシロCPU - この連載の一覧へ