2012/06/02 関東GPGPU勉強会 #kantogpu
錦糸町のネットエージェントさんのセミナールームで開催された、
関東GPGPU勉強会に行ってきました。
ATND
togetter
低レイヤの話!非常に楽しかったです!
加藤公一さん(@hamukazu)
「GPGPU、この3年でどう変わったか」
資料はこちら
・GPUの進化によってアルゴリズムが変わってくる
例)k近傍探索をn-bodyで解く
関連のネタ
・開発環境が劇的に変化
コンパイラにバグ!
今は非常に優秀
山田さん(@telmin_orca)
「GPGPU DE いろんな問題を解いてみたりした」
資料は公開され次第アップします。
openCLをやっている人
・Heterogineousが重要
・巡回セールスマン問題を解いてみた
必ずアントコロニーで解く発表があるらしい
モナリザを都市に見立てて高速に解く。
単純化し、GPUで並列処理をするために、問題を分割する(画面を区切る)
AMDは遅い、CPU:nVIDIA:AMDで2:1:3くらいか
個人的には、CPUと比較して以外とGPUは性能が上がりません、と思いました。
・Aobenchを走らせてみた
AMD,nVIDIAとも早い。が、分析してみるとAMDはデータ転送とカーネルの起動が遅い?
@iitakuさん
「LLVM meets GPU」
資料はこちら
low level VM
去年あたりからLLVMの実装がGPU向けに入っている
これを使っていろいろやってみた
boost::pythonなんてあるのか
@ponkotuyさん
「GPGPUと流体計算」
資料はこちら
GTX680、メモリが削減されている。GK110はこれが改善されている
1.5TFlops
流体計算ではシミュレーション領域を矩形に区切る。並列化は簡単。
@w_o さん
「SASSの読み方」
資料はこちら
アセンブラ出せるの、知りませんでした。
@fjnli さん
「NVIDIA GPUのメモリモデルと仲良くなる」
キャッシュやメモリ階層の話
Shared Memory、Texture Memory、いろんなメモリ
Occupancy、スレッドの同時実行性能。Compute Profilerを使うと良い。レイテンシは隠ぺいしやすい。
Hot Clockはフェルミの後からなくなった。
@foota さん
TopCoder/NVIDIA主催CUDAプログラミングコンテスト参加記
CPUとGPUのどちらに処理をやらせるかの切り分けも大事なようです
以下、LT
岡本さん
関西GPGPU勉強会について
おみやげいただきました。
また機会があれば、参加したいです。
関東GPGPU勉強会に行ってきました。
ATND
togetter
低レイヤの話!非常に楽しかったです!
加藤公一さん(@hamukazu)
「GPGPU、この3年でどう変わったか」
資料はこちら
・GPUの進化によってアルゴリズムが変わってくる
例)k近傍探索をn-bodyで解く
関連のネタ
・開発環境が劇的に変化
コンパイラにバグ!
今は非常に優秀
山田さん(@telmin_orca)
「GPGPU DE いろんな問題を解いてみたりした」
資料は公開され次第アップします。
openCLをやっている人
・Heterogineousが重要
・巡回セールスマン問題を解いてみた
必ずアントコロニーで解く発表があるらしい
モナリザを都市に見立てて高速に解く。
単純化し、GPUで並列処理をするために、問題を分割する(画面を区切る)
AMDは遅い、CPU:nVIDIA:AMDで2:1:3くらいか
個人的には、CPUと比較して以外とGPUは性能が上がりません、と思いました。
・Aobenchを走らせてみた
AMD,nVIDIAとも早い。が、分析してみるとAMDはデータ転送とカーネルの起動が遅い?
@iitakuさん
「LLVM meets GPU」
資料はこちら
low level VM
去年あたりからLLVMの実装がGPU向けに入っている
これを使っていろいろやってみた
boost::pythonなんてあるのか
@ponkotuyさん
「GPGPUと流体計算」
資料はこちら
GTX680、メモリが削減されている。GK110はこれが改善されている
1.5TFlops
流体計算ではシミュレーション領域を矩形に区切る。並列化は簡単。
@w_o さん
「SASSの読み方」
資料はこちら
アセンブラ出せるの、知りませんでした。
@fjnli さん
「NVIDIA GPUのメモリモデルと仲良くなる」
キャッシュやメモリ階層の話
Shared Memory、Texture Memory、いろんなメモリ
Occupancy、スレッドの同時実行性能。Compute Profilerを使うと良い。レイテンシは隠ぺいしやすい。
Hot Clockはフェルミの後からなくなった。
@foota さん
TopCoder/NVIDIA主催CUDAプログラミングコンテスト参加記
CPUとGPUのどちらに処理をやらせるかの切り分けも大事なようです
以下、LT
岡本さん
関西GPGPU勉強会について
おみやげいただきました。
また機会があれば、参加したいです。