i7 6700K (Skylake) エンコード ベンチマーク
昨日(8/5)、Skylakeが発売された。
まあ平日なので、じっくり見れてないけど、さくっとベンチマークでも。(Skylake以外の環境はこの前の土日に測定済み)
なんか妙なパッケージになった。昔のCDとかDVDの包装にありそう。
関連記事
i7 6700Kのメモリ帯域
i7 6700K (Skylake) オーバークロック
i7 6700K
Skylakeの最上位となるi7 6700K。
CPU-Z
絶対電圧はおかしいと思う。まだ未対応なのだろうか? 新しいのを使ったつもりだが…
メモリはまだ適当。土日にでもクロックをあげてみよう。
比較環境
なるべく環境をそろえて比較する。定格に興味はないし、DDR3-1600とかにも興味はない。
ほかのベンチマークはメモリクロックを合わせずにやってしまうのだろうから、ここでは動作周波数とメモリクロックを合わせて比較する。L3キャッシュ容量も同じなので、3770K - 4770K- 6700Kをほぼきれいにそろえて比較できる。(メモリのレイテンシとかは残念ながら除く)
5960Xは参考までに。Uncoreを4.2GHzで動かす設定を忘れてしまったので、3.8GHzとなっている。4.2に合わせられずすこし悔しかった。
x264 /x265
共通環境
Win8.1 x64
Aviutl 1.00
x264guiEx 2.32
x265guiEx 2.62
x264 rev2538 x64 8bit/10bit (Komisar氏 kMod版)
x265 1.7+373
lwinput.aui (L-SMASH Works) r785
ソース
Charlotte OP を一度x265 + x264guiEx + afsでエンコードしたもの。
1920x1080p 23.976fps 約1分30秒
x264
--preset veryfast, medium, slow, slower
x265
--crf 21 --pmode
--preset medium, slow, slower
結果
4770K比で、時折20%程度伸びているものもあるが、基本は+10%ちょっと、といったところだろうか。
こちらも4770K比で+10~20%程度。まあそれなりには伸びている。
QSVBenchmark
Avisynth+ r1576
LSMASHSource.dll
QSVEncC 2.06 (x86)
ソース
MPEG2 1920x1080p 10.6Mbps 29.97fps 5203フレーム
H.264 1920x1080p 25.1Mbps 23.976fps 2293フレーム
QSVEnc エンコード設定
--cqp 24:25:27 --benchmark result.txt --output-res 1920x1080 or 1280x720
結果: 入力: MPEG2の場合
(棒グラフが速度、折れ線がCPU使用率)
Ivy→Haswellでは、同じ設定でもHaswellがより高品質寄りに振られ、遅くなるのはわかっているので、Ivyは参考まで。
Haswell→Skylakeでは、25~50%の大幅な高速化となっている。GPUのEU数が20→24に増えたのもあるだろうが、QSVのハードウェア回路か、あるいはEUそのものにも改良があったと思われる。
結果: 入力: H.264の場合
(棒グラフが速度、折れ線がCPU使用率)
Haswell→Skylakeでは、1080pのエンコードが2倍近く高速化しているのが目を引く。SkylakeではHEVCハードウェアエンコードが注目されているが、既存のH.264エンコードも順当に強化されていることがわかる。
QSVEnc、まだHEVCエンコードはできません。土日になったら調べてみます。
…なんか入れているグラフィックドライバが不安定なので、そのせいかもですが、ちょっと時間ないです…
Skylakeについて
Skylakeは同クロックのHaswellと比べ、エンコードでは10%程度は確実に高速化しているようだ(よくて20%)。ただ、14nmになって使用できるトランジスタ数が激増する中で改良したアーキテクチャが、10%程度というのはいかにもさみしいものがある。
今回は、AVX-512が見送られたため、Ivy→Haswellのような新命令による上乗せもない。
また、オーバークロックはまだ試していないが、14nmはクロックあげにくいという話もある。 → プロセスのせいというより、単にグリスのせいだよね…毎度言っているように、重要なのは電力じゃなくて、それを冷やせるかどうかだから…
またグリス(改)とかで来年新製品を出すためなのだろうか…。
まあそれはそれとして。
Skylakeのスループット、レイテンシを計測したものが公開されている。
これによると、Skylakeでは多くの変更がなされていることがわかる。
浮動小数点SIMD
加算/比較/最大/最小 … スループット: 1命令/cycle → 2命令/cycleに強化
加算/積算 … レイテンシ: 3cycle→4cycleに劣化 (せっかくBroadwellで強化したのに謎)
積和算 … レイテンシ: 5cycle→4cycleに強化
除算/平方根 … スループット/レイテンシとも大幅に高速化
と、なんか一部劣化しつつも、基本はかなり強化されている。とくにHaswellから比べると除算が大幅に高速化されているのはうれしい。ベンチマークプログラムでは遅い除算などなるべく使わないよう最適化されているのだろうが、現実にはそんなプログラムばかりではないので。
整数SIMD
加減算 スループット: 2命令/cycle → 3命令/cycleに強化
積算 スループット: 1命令/cycle → 2命令/cycleに強化
シフト命令 スループット: 1命令/cycle → 2命令/cycleに強化
vpblendvb スループット: 0.5命令/cycle → 1命令/cycleに強化
vpsadbw レイテンシ: 5cycle→3cycleに強化
とまあこちらもかなり強化されている。SandraのIntegerがSkylakeでやたら伸びているベンチマークをみかけるのも、加減算スループット増強によるものと思われる。
一方、残念なことにshuffle/vpalignr/vperm系統のスループットは1命令/cycleに劣化したままだし、AVX/AVX2命令で128bit境界を越えるのに3cycleもかかってしまう残念っぷりも依然として直っていないようだ。
加減算を増やすついでにshuffleも増やせばよかったのに…。
まあそれでも浮動小数・整数ともに演算器はそこそこ強化されているようだ。これだけやって、10%というのは…。またHaswellのとき同様、デコード部を根本的にはいじらなかったのだろうか…。
ともかく、QSVはかなり高速化しているし、HEVCも使えるらしいし、その点では面白い。ただ、CPUは+10%ちょっと、よくても+20%だし、しかも円安のせいでかなり値段が高い。確実に円高絶頂のIvyよりはコスパ悪い気がする…。コスパ悪いならいっそHaswell-Eでいいかもと思ったり…。
さて、あとは
・オーバークロック
・HEVCエンコ
・DDR4メモリならではのメモリ帯域
とかを今後試してみたい。
関連記事
i7 6700Kのメモリ帯域
i7 6700K (Skylake) オーバークロック
まあ平日なので、じっくり見れてないけど、さくっとベンチマークでも。(Skylake以外の環境はこの前の土日に測定済み)
なんか妙なパッケージになった。昔のCDとかDVDの包装にありそう。
関連記事
i7 6700Kのメモリ帯域
i7 6700K (Skylake) オーバークロック
i7 6700K
Skylakeの最上位となるi7 6700K。
CPU-Z
絶対電圧はおかしいと思う。まだ未対応なのだろうか? 新しいのを使ったつもりだが…
メモリはまだ適当。土日にでもクロックをあげてみよう。
比較環境
なるべく環境をそろえて比較する。定格に興味はないし、DDR3-1600とかにも興味はない。
ほかのベンチマークはメモリクロックを合わせずにやってしまうのだろうから、ここでは動作周波数とメモリクロックを合わせて比較する。L3キャッシュ容量も同じなので、3770K - 4770K- 6700Kをほぼきれいにそろえて比較できる。(メモリのレイテンシとかは残念ながら除く)
5960Xは参考までに。Uncoreを4.2GHzで動かす設定を忘れてしまったので、3.8GHzとなっている。4.2に合わせられずすこし悔しかった。
CPU | i7 6700K | i7 5960X | i7 4770K | i7 3770K |
---|---|---|---|---|
CPU Gen | Skylake | Haswell-E | Haswell | IvyBridge |
プロセス | 14nm | 22nm | 22nm | 22nm |
プロセス | 4C/8T | 8C/16T | 4C/8T | 4C/8T |
定格動作周波数 | 4.0-4.2GHz | 3.0-3.5GHz | 3.5-3.9GHz | 3.5-3.9GHz |
設定動作周波数 | 4.2GHz | 4.2GHz / Uncore3.8GHz | 4.2GHz | 4.2GHz |
キャッシュ | L3=8MB | L3=8MB | L3=8MB | L3=8MB |
メモリ | DDR4-2400, 2ch, 16GB | DDR4-2400, 2ch, 32GB | DDR3-2400, 2ch, 16GB | DDR3-2400, 2ch, 16GB |
レイテンシ | 15-15-15-36 | 15-15-15-36 | 10-12-12-31 | 10-12-12-31 |
マザーボード | Asroc Z170 Extreme7+ | ASUS X99 Deleuxe | ASUS Z87 Gryphon | ASUS P8Z77-M |
OS | Win 8.1 x64 | Win 8.1 x64 | Win 8.1 x64 | Win 8.1 x64 |
x264 /x265
共通環境
Win8.1 x64
Aviutl 1.00
x264guiEx 2.32
x265guiEx 2.62
x264 rev2538 x64 8bit/10bit (Komisar氏 kMod版)
x265 1.7+373
lwinput.aui (L-SMASH Works) r785
ソース
Charlotte OP を一度x265 + x264guiEx + afsでエンコードしたもの。
1920x1080p 23.976fps 約1分30秒
x264
--preset veryfast, medium, slow, slower
x265
--crf 21 --pmode
--preset medium, slow, slower
結果
4770K比で、時折20%程度伸びているものもあるが、基本は+10%ちょっと、といったところだろうか。
こちらも4770K比で+10~20%程度。まあそれなりには伸びている。
QSVBenchmark
Avisynth+ r1576
LSMASHSource.dll
QSVEncC 2.06 (x86)
ソース
MPEG2 1920x1080p 10.6Mbps 29.97fps 5203フレーム
H.264 1920x1080p 25.1Mbps 23.976fps 2293フレーム
QSVEnc エンコード設定
--cqp 24:25:27 --benchmark result.txt --output-res 1920x1080 or 1280x720
結果: 入力: MPEG2の場合
(棒グラフが速度、折れ線がCPU使用率)
Ivy→Haswellでは、同じ設定でもHaswellがより高品質寄りに振られ、遅くなるのはわかっているので、Ivyは参考まで。
Haswell→Skylakeでは、25~50%の大幅な高速化となっている。GPUのEU数が20→24に増えたのもあるだろうが、QSVのハードウェア回路か、あるいはEUそのものにも改良があったと思われる。
結果: 入力: H.264の場合
(棒グラフが速度、折れ線がCPU使用率)
Haswell→Skylakeでは、1080pのエンコードが2倍近く高速化しているのが目を引く。SkylakeではHEVCハードウェアエンコードが注目されているが、既存のH.264エンコードも順当に強化されていることがわかる。
QSVEnc、まだHEVCエンコードはできません。土日になったら調べてみます。
…なんか入れているグラフィックドライバが不安定なので、そのせいかもですが、ちょっと時間ないです…
Skylakeについて
Skylakeは同クロックのHaswellと比べ、エンコードでは10%程度は確実に高速化しているようだ(よくて20%)。ただ、14nmになって使用できるトランジスタ数が激増する中で改良したアーキテクチャが、10%程度というのはいかにもさみしいものがある。
今回は、AVX-512が見送られたため、Ivy→Haswellのような新命令による上乗せもない。
また、オーバークロックはまだ試していないが、
またグリス(改)とかで来年新製品を出すためなのだろうか…。
まあそれはそれとして。
Skylakeのスループット、レイテンシを計測したものが公開されている。
これによると、Skylakeでは多くの変更がなされていることがわかる。
浮動小数点SIMD
加算/比較/最大/最小 … スループット: 1命令/cycle → 2命令/cycleに強化
加算/積算 … レイテンシ: 3cycle→4cycleに劣化 (せっかくBroadwellで強化したのに謎)
積和算 … レイテンシ: 5cycle→4cycleに強化
除算/平方根 … スループット/レイテンシとも大幅に高速化
と、なんか一部劣化しつつも、基本はかなり強化されている。とくにHaswellから比べると除算が大幅に高速化されているのはうれしい。ベンチマークプログラムでは遅い除算などなるべく使わないよう最適化されているのだろうが、現実にはそんなプログラムばかりではないので。
整数SIMD
加減算 スループット: 2命令/cycle → 3命令/cycleに強化
積算 スループット: 1命令/cycle → 2命令/cycleに強化
シフト命令 スループット: 1命令/cycle → 2命令/cycleに強化
vpblendvb スループット: 0.5命令/cycle → 1命令/cycleに強化
vpsadbw レイテンシ: 5cycle→3cycleに強化
とまあこちらもかなり強化されている。SandraのIntegerがSkylakeでやたら伸びているベンチマークをみかけるのも、加減算スループット増強によるものと思われる。
一方、残念なことにshuffle/vpalignr/vperm系統のスループットは1命令/cycleに劣化したままだし、AVX/AVX2命令で128bit境界を越えるのに3cycleもかかってしまう残念っぷりも依然として直っていないようだ。
加減算を増やすついでにshuffleも増やせばよかったのに…。
まあそれでも浮動小数・整数ともに演算器はそこそこ強化されているようだ。これだけやって、10%というのは…。またHaswellのとき同様、デコード部を根本的にはいじらなかったのだろうか…。
ともかく、QSVはかなり高速化しているし、HEVCも使えるらしいし、その点では面白い。ただ、CPUは+10%ちょっと、よくても+20%だし、しかも円安のせいでかなり値段が高い。確実に円高絶頂のIvyよりはコスパ悪い気がする…。コスパ悪いならいっそHaswell-Eでいいかもと思ったり…。
さて、あとは
・オーバークロック
・HEVCエンコ
・DDR4メモリならではのメモリ帯域
とかを今後試してみたい。
関連記事
i7 6700Kのメモリ帯域
i7 6700K (Skylake) オーバークロック