x265 2.7+336 AVX512対応の効果

x265がついにAVX512に対応し速度の出るビルドもできるようになったので、AVX512の効果がどのくらいか、確認してみた。

x265公式には、4K HDRで15%みたいな話があったりするけど、1080pだとだいたい~10%ぐらい?

AVX512の使用法



AVX512を使用するには、--asm avx512をつける必要があるので、x265guiExではコマンド入力欄に"--asm avx512"をいれておくと、AVX512が使われる。


x265 [info]: HEVC encoder version 2.7+336-07defe235cde
x265 [info]: build info [Windows][GCC 7.3.0][64 bit] 10bit
x265 [info]: using cpu capabilities: MMX2 SSE2Fast LZCNT SSSE3 SSE4.2 AVX FMA3 BMI2 AVX2 AVX512
x265 [info]: Main 10 profile, Level-4 (Main tier)


--asm avx512をつけないと、AVX512が使えるCPUであっても、AVX512は使用されない。


x265 [info]: HEVC encoder version 2.7+336-07defe235cde
x265 [info]: build info [Windows][GCC 7.3.0][64 bit] 10bit
x265 [info]: using cpu capabilities: MMX2 SSE2Fast LZCNT SSSE3 SSE4.2 AVX FMA3 BMI2 AVX2
x265 [info]: Main 10 profile, Level-4 (Main tier)





AVX512最適化の効果



実験環境
i9 7980XE (18C/36T, 4GHz、AVX offsetなし)
電源設定: 高パフォーマンス

Aviutl 1.00
x265guiEx 3.67v2
x265 3.6+336 (fprofiled あり版 と なし版)

x265オプション
--crf 21 --preset <各種プリセット> [--output-depth 10] [--asm avx512]

※ --asm avx512をつけるとAVX512が使われ、つけなければ使われない。

ソース
sample_movie_1080p.mpg (1920x1080, 29.97fps, 5203frame, 2分53秒)

結果


だいたい5~10%といったところで、高速化しているものの、AVX2の20~30%のように非常に大きな効果というわけでもないみたい。

まあ、Intelから出ている資料では、1080pだと10%弱にとどまっているので、それにマッチする結果だと思う。この資料では、カーネル単位で高速化率を見たグラフがあるけど、カーネル単位で見ても平均30%前後、ほとんど速くなっていないものもあるので、まあ過度な期待は禁物、ということかもしれない。

また、今回はCPUを4.0GHz固定として、AVX2/AVX512 Offsetも切っているけど、AVX512 Offsetが大きめだったりすると、もしかすると効果がより弱くなってしまうかもしれない(まあ、冷却が十分ならAVX512 Offsetを有効にしなければよいだけだが)。

コメントの投稿

非公開コメント

期待したい

良いですねコレ
ちょっと期待してしまいます。
AMDがコレに刺激を受けて対抗する命令セットを発表してくれたり
互換の命令セットを発表してくれていたりすると嬉しいですが

これもQSVみたいにCeleron等の低価格CPUでも使えるようになるのかなぁ

ファイル重複とx264更新

●x265の配布フォルダ(OneDrive/GoogleDriveとも)で
 "current version is ..."のファイルが重複しているようです。
 (古いcurrent version is 2.8+40.txtが残っている)
 もしかするとx265guiExのバイナリ更新に影響するかもしれないと思ったのでご連絡。

●ついでですが、8/6にx264の更新(r2932?)があったようです。

Re: ファイル重複とx264更新

ファイルの重複とx264の更新の件、教えていただきありがとうございます。

"current version"のファイルは簡易インストーラへの影響はありませんが、古いcurrent versionは削除しました。

また、x264をr2932に更新しました。

No title

x264 r2932の対応ありがとうございます。
ただ、oldフォルダの方にx64バイナリが置かれていないようです。

Re: No title

ありがとうございます。x264/x265ともに再度更新しました。
プロフィール

rigaya

Author:rigaya
アニメとか見たり、エンコードしたり。
連絡先: [email protected]
github twitter

最新記事
最新コメント
カテゴリ
月別アーカイブ
カウンター
検索フォーム
いろいろ
公開中のAviutlプラグインとかのダウンロード

○Aviutl 出力プラグイン
x264guiEx 3.xx
- x264を使用したH264出力
- x264guiExの導入紹介動画>
- x264guiExの導入
- x264guiExのエラーと対処方法>
- x264.exeはこちら&gt

x265guiEx
- x265を使用したH.265/HEVC出力
- x265guiExの導入>
- x265.exeはこちら&gt

QSVEnc + QSVEncC
- QuickSyncVideoによるHWエンコード
- QSVEnc 導入/使用方法&gt
- QSVEncCオプション一覧&gt

NVEnc + NVEncC
- NVIDIAのNVEncによるHWエンコード
- NVEnc 導入/使用方法&gt
- NVEncCオプション一覧&gt

VCEEnc + VCEEncC
- AMDのVCE/VCNによるHWエンコード
- VCEEnc 導入/使用方法&gt
- VCEEncCオプション一覧&gt

svtAV1guiEx
- SVT-AV1によるAV1出力
- svtAV1guiExの導入>
- SVT-AV1単体はこちら&gt

VVenCguiEx
- VVenCによるVVC出力
- VVenCguiExの導入>

ffmpegOut
- ffmpegを使用した出力
- ffmpegOutの導入>


○Aviutl フィルタプラグイン
自動フィールドシフト
- SSE2~AVX512による高速化版
- オリジナル: aji様

clcufilters 
- OpenCL/CUDAのGPUフィルタ集
- 対応フィルタの一覧等はこちら

エッジレベル調整MT
- エッジレベル調整の並列化/高速化
- SSE2~AVX512対応
- オリジナル: まじぽか太郎様

バンディング低減MT
- SSE2~AVX512による高速化版
- オリジナル: まじぽか太郎様

PMD_MT
- SSE2~AVX512による高速化版
- オリジナル: スレ48≫989氏

透過性ロゴ (ミラー)
- SSE2~FMA3によるSIMD版
- オリジナル: MakKi氏

AviutlColor
- BT.2020nc向け色変換プラグイン
- BT.709/BT.601向けも同梱

○その他
Amatsukaze改造版
- AmatsukazeのAV1対応版

tsreplace
- tsの映像のみを置き換えて圧縮

rkmppenc
- Rockchip系SoCのhwエンコーダ

fawutil
- FAW(FakeAACWave)⇔aac変換
- 二重音声の取り扱いにも対応

x264afs (ミラー)
- x264のafs対応版

aui_indexer (使い方>)
- lsmashinput.aui/m2v.auiの
 インデックス事前・一括生成

auc_export (ミラー使い方>)
- Aviutl Controlの
 エクスポートプラグイン版
 エクスポートをコマンドから

aup_reseter
- aupプロジェクトファイルの
 終了フラグを一括リセット

CheckBitrate (使い方)
- ビットレート分布の分析(HEVC対応)

チャプター変換 (使い方>)
- nero/appleチャプター形式変換

エッジレベル調整 (avisynth)
- Avisynth用エッジレベル調整

メモリ・キャッシュ速度測定
- スレッド数を変えて測定
- これまでの測定結果はこちら

○ビルドしたものとか
L-SMASH (ミラー)
x264 (ミラー)
x265 (ミラー)
SVT-AV1 (ミラー)

○その他
サンプル動画
その他

○読みもの (ミラー)
Aviutl/x264guiExの色変換
動画関連ダウンロードリンク集
簡易インストーラの概要

○更新停止・公開終了
改造版x264gui
x264guiEx 0.xx
RSSリンクの表示
リンク
QRコード
QR