このページの本文へ

前へ 1 2 次へ

ロードマップでわかる!当世プロセッサー事情 第271回

スーパーコンピューターの系譜 代表作CRAY-1と地球シミュレータ

2014年09月22日 12時00分更新

文● 大原雄介(http://www.yusuke-ohara.com/

  • この記事をはてなブックマークに追加
  • 本文印刷

 「次は連載でなにやりましょう?」「プロセスルールの話でナノやマイクロといった小さい数字が続いたので、今度は大きな数字の話がいいです」「(なんだそれ)大きい、というとスパコンとかですかね」「あ、それいいですね、やりましょう」

 ……という、担当編集氏との白熱した議論の結果、今回からスーパーコンピューターの系譜について説明していく。今回は0回目というか系譜の事前準備という形で、スーパーコンピューターそのものに触れていきたい。

スーパーコンピューターの代表作
CRAY-1

 そもそもこの手の話をする場合、スーパーコンピューターってなに? という問題が常に付きまとう。例えばスーパーコンピューターの代表例として名高い「CRAY-1」であるが、性能はどの程度かというと80MHz駆動で160MFLOPSとなっている。

ドイツ博物館に保管されているCRAY-1。画像はWikimedia Commonsより(http://commons.wikimedia.org/wiki/File:Cray-1-deutsches-museum.jpg)

 CRAY-1もいろいろ派生型があって性能もまちまちなのだが、ここではCRAY Historyに出てきた数字を利用している。

 この160MFLOPS(1秒間に1億6000万回の浮動小数点演算が行なえる)という性能であるが、実はARMの「Cortex-M4」というMCUコアに、オプションで用意されるFPUのスループットが1MFLOPS/MHz(ただし単精度のみ)であり、160MHz駆動のCortex-M4Fマイコンとほぼ同程度の性能ということになる。

 NXPは最大204MHz駆動のLPC4300シリーズを昨年ラインナップしており、これにもFPUが搭載されているから、ピーク性能は確実にCRAY-1を抜いている。

 もう少し一般的なところでは、2008年にインテルからネットブック向けプロセッサーとして発売された「Atom N270」のFPU性能は2.1GFLOPSに達するといった性能評価もあるほどで、今からすればCRAY-1の性能はそこらへんのマイコン程度でしかない、ということになる。

 もちろんこの評価は公平ではない。CRAY-1がリリースされたのは1976年で、Cortex-M4やAtom N270がリリースされるまでに30年以上の時間が経過しているわけで、この時期を無視して議論するのはフェアではない。

 では逆にCRAY-1が登場した1976年はどんなプロセッサーがあったのだろうか。インテルが8085をリリースしたばかりの頃である。8085は8080の後継品で、動作周波数はこの当時は3MHzどまりでなかったかと記憶している。

Intel 8085。画像はWikimedia Commonsより(http://commons.wikimedia.org/wiki/File:Intel_P8085AH-2.jpg)

 整数演算性能は3MIPSという計算になるが、FPUは搭載しておらず、外付けでも存在しないので、どうしても浮動小数点演算を行なおうとするとソフトウェアでのエミュレーションとなる。この当時に8085で浮動小数点演算をエミュレーションでやらせた場合の性能は探したが見つからなかった。

 ただ一般にFPUをALU(整数演算ユニット)でエミュレーションすると50~1000倍程度時間がかかる(これはなにと比較するかによってばらつきが大きい)から、とりあえず100倍とすると、8085の性能はおそらく0.03MFLOPSほどになる。CRAY-1と比較すると5000倍以上の性能差になるわけだ。

 マイコンではなくメインフレームではどうかというと、翌年の1977年にIBMは「IBM 3033」と呼ばれるプロセッサーをリリースしている。System/370として知られる、仮想記憶を実装したシステム向けのハイエンドプロセッサーで、IBMでは“The Big One”と呼んでいた(関連リンク)。

IBM 3033を使用したシステム(IBMのウェブサイトより抜粋)

 これがどの程度の速度かというと、これまた資料が乏しいのだが、こちらの表を見ると、1973年にラインナップされているIBM370/158がmy MIPS換算で0.64、LINPACKの速度が0.23MFLOPSとされている。1978年のIBM3033では、my MIPS換算が2.37となっており、ここから計算するとLINPACKの性能はおおよそ0.85MFLOPS程度と推定される。

 一方前述の表には、CRAY-1の結果も1978年に入っており、こちらは堂々12MFLOPSである。IBMの3033の価格は360万ドル(当時のドル/円の為替レートは268円前後だったので、日本円にすると約10億円相当)で、一方CRAY-1は800万ドル(同じく21億4000万円相当)とさらに高価ではあったが、10倍以上の性能差に対して価格差は2.5倍だから、ずいぶん「お安い」買い物だったという考え方もできる。

→次のページヘ続く (Pentium 4を5120台並べれば地球シミュレータを抜けるか?

※編注:記事の内容についての指摘をいくつか受けていますが、その点に関しては次回更新分(連載273回)で補足いたします。

前へ 1 2 次へ

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン