Skylake-XのAVX512とか爆熱ぶりとか
なんかいろいろ微妙らしいSkylake-Xについて…
いや、ほんといろいろ面白い。
まず演算器から。
http://users.atw.hu/instlatx64/GenuineIntel0050654_SkylakeX_InstLatX64.txt
この情報とかから推測すると…
・基本的にはSkylakeと変わらない
・変わったのはAVX512
・port0+1にあった256bit演算器を束ねてAVX-512として使える
・port5にあった演算器は(原則)512bit演算器に拡張された
・ついでに浮動小数のadd/sub/mul/fmaはport5に512bit演算器を追加
・port0だけだった一部のSIMD命令は256bitx2回に分けて実行 (div/sqrt/rcp)
・512bit gatherが(相対的に)速い
・512bitでもクロスレーンはレイテンシ3cycle
例外はあると思うけど、大雑把に推測するとこんな感じ?
※↑ただの推測です
もうだいぶ前の、比較的おとなしめで微妙な性能向上にとどまったSkylakeの拡張は、これを見越してのことだったのかなあ、というのがなんとなくわかる気がする。
AVX512の恩恵があるものとないものがはっきり…。FPのadd/mul/sub/fmaは2倍、Intのadd/sub/and/or/xor/andnなどは1.33倍、shuffleは2倍といった速度向上がある一方で、まるで速度が上がらないものも…。vpternlog(論理3入力演算)がうまく使えれば論理演算はもっと性能上がりそう。
とまあ、AVX512まわりは結構頑張ってる感じだけど、そのほかのAVX512未使用の性能は順当にSkylakeを10コアにした感じの模様で、クロックの向上もあってそれなりの性能向上は期待できるみたい。
問題は、性能向上と一緒に発熱量も向上してしまったことで、とにかく多くのベンチマークの記事を見てもたいてい「熱い」って書いてあってなんだかなあ、という印象。どうもAVX512を使わなくても熱いようなので、AVX512のせいだけじゃないみたい。単にクロックを上げすぎたのか、あるいはL2/L3あたりの改造が裏目に出たのか…。
そのうえ、理解に苦しむ事にはんだじゃなくてグリスなので、より高温になってさらに消費電力が増える、という状態になっている気がする。
PCWatch …わりと当たり石 ? 「比較的おとなしい温度」
ascii … 「それほどでもない」 70℃以下におさまる
4.gamer … 「故障が気がかりになるレベル」,「莫大な消費電力はちょっと引くレベル」
tomshardware … 「グリスでさえなければ優秀だった」、「20℃の冷風を送風すれば良い」
guru3d … 「一瞬TDP=140Wという数字が信じられなかった」
techspot … 本格水冷すれば、結構行ける
AnandTech … CPU性能は優秀
PCWorld … 優秀だが、ThreadRipperと比べないと…?
もうレビューごとの違いが面白すぎてそれだけでお腹いっぱいになりそう…。
そもそもコア数が多くて、AVX512を載せて、さらにクロックを引き上げているSkylake-Xが熱くなることは(ここまでとは思わなかったけど)わかりきっているのに、これをグリスにしようとしたのは本当に正気じゃない気がする…。
ついでにマザーまで熱くなるらしい…。寿命が短そうで怖い。
18コア版まで出揃うのを待ってから、冬に暖房機として買うのがよいのかしら…。
いや、ほんといろいろ面白い。
まず演算器から。
http://users.atw.hu/instlatx64/GenuineIntel0050654_SkylakeX_InstLatX64.txt
この情報とかから推測すると…
・基本的にはSkylakeと変わらない
・変わったのはAVX512
・port0+1にあった256bit演算器を束ねてAVX-512として使える
・port5にあった演算器は(原則)512bit演算器に拡張された
・ついでに浮動小数のadd/sub/mul/fmaはport5に512bit演算器を追加
・port0だけだった一部のSIMD命令は256bitx2回に分けて実行 (div/sqrt/rcp)
・512bit gatherが(相対的に)速い
・512bitでもクロスレーンはレイテンシ3cycle
例外はあると思うけど、大雑把に推測するとこんな感じ?
Haswell | Skylake | Skylake-X | ||
---|---|---|---|---|
FP | add/sub | 256bit x1 | 256bit x2 | 256bit x2 + 512bit x1 |
mul/fma | 256bit x2 | 256bit x2 | 256bit x2 + 512bit x1 | |
div/sqrt/rcp | 256bit x1 | 256bit x1 | 256bit x1 | |
Int | and/or/xor/andn | 256bit x3 | 256bit x3 | 256bit x2 + 512bit x1 |
add/sub | 256bit x2 | 256bit x3 | 256bit x2 + 512bit x1 | |
adds/subs | 256bit x2 | 256bit x2 | 256bit x2 | |
mul | 256bit x1 | 256bit x2 | 256bit x2 | |
min/max/cmp abs/shift | 256bit x1 | 256bit x2 | 256bit x2 | |
sad | 256bit x1 | 256bit x1 | 512bit x1 | |
shuffle/perm alignr/broadcast | 256bit x1 | 256bit x1 | 512bit x1 | |
blend | 256bit x1 | 256bit x1 ? | 256bit x2 + 512bit x1 (EVEXのみ) | |
rotate | - | - | 256bit x2 ? | |
ternlog | - | - | 256bit x2 + 512bit x1 ? |
※↑ただの推測です
もうだいぶ前の、比較的おとなしめで微妙な性能向上にとどまったSkylakeの拡張は、これを見越してのことだったのかなあ、というのがなんとなくわかる気がする。
AVX512の恩恵があるものとないものがはっきり…。FPのadd/mul/sub/fmaは2倍、Intのadd/sub/and/or/xor/andnなどは1.33倍、shuffleは2倍といった速度向上がある一方で、まるで速度が上がらないものも…。vpternlog(論理3入力演算)がうまく使えれば論理演算はもっと性能上がりそう。
とまあ、AVX512まわりは結構頑張ってる感じだけど、そのほかのAVX512未使用の性能は順当にSkylakeを10コアにした感じの模様で、クロックの向上もあってそれなりの性能向上は期待できるみたい。
問題は、性能向上と一緒に発熱量も向上してしまったことで、とにかく多くのベンチマークの記事を見てもたいてい「熱い」って書いてあってなんだかなあ、という印象。どうもAVX512を使わなくても熱いようなので、AVX512のせいだけじゃないみたい。単にクロックを上げすぎたのか、あるいはL2/L3あたりの改造が裏目に出たのか…。
そのうえ、理解に苦しむ事にはんだじゃなくてグリスなので、より高温になってさらに消費電力が増える、という状態になっている気がする。
PCWatch …わりと当たり石 ? 「比較的おとなしい温度」
ascii … 「それほどでもない」 70℃以下におさまる
4.gamer … 「故障が気がかりになるレベル」,「莫大な消費電力はちょっと引くレベル」
tomshardware … 「グリスでさえなければ優秀だった」、「20℃の冷風を送風すれば良い」
guru3d … 「一瞬TDP=140Wという数字が信じられなかった」
techspot … 本格水冷すれば、結構行ける
AnandTech … CPU性能は優秀
PCWorld … 優秀だが、ThreadRipperと比べないと…?
もうレビューごとの違いが面白すぎてそれだけでお腹いっぱいになりそう…。
そもそもコア数が多くて、AVX512を載せて、さらにクロックを引き上げているSkylake-Xが熱くなることは(ここまでとは思わなかったけど)わかりきっているのに、これをグリスにしようとしたのは本当に正気じゃない気がする…。
ついでにマザーまで熱くなるらしい…。寿命が短そうで怖い。
18コア版まで出揃うのを待ってから、冬に暖房機として買うのがよいのかしら…。