fc2ブログ

2012/06/02 関東GPGPU勉強会 #kantogpu

錦糸町のネットエージェントさんのセミナールームで開催された、
関東GPGPU勉強会に行ってきました。
ATND
togetter

低レイヤの話!非常に楽しかったです!

加藤公一さん(@hamukazu)
 「GPGPU、この3年でどう変わったか」
 資料はこちら
・GPUの進化によってアルゴリズムが変わってくる
 例)k近傍探索をn-bodyで解く
 関連のネタ
・開発環境が劇的に変化
 コンパイラにバグ!
 今は非常に優秀

山田さん(@telmin_orca)
 「GPGPU DE いろんな問題を解いてみたりした」
 資料は公開され次第アップします。
 openCLをやっている人 
・Heterogineousが重要
・巡回セールスマン問題を解いてみた
 必ずアントコロニーで解く発表があるらしい
 モナリザを都市に見立てて高速に解く。
 単純化し、GPUで並列処理をするために、問題を分割する(画面を区切る)
 AMDは遅い、CPU:nVIDIA:AMDで2:1:3くらいか
 個人的には、CPUと比較して以外とGPUは性能が上がりません、と思いました。
・Aobenchを走らせてみた
 AMD,nVIDIAとも早い。が、分析してみるとAMDはデータ転送とカーネルの起動が遅い?

@iitakuさん
「LLVM meets GPU」
 資料はこちら
 low level VM
 去年あたりからLLVMの実装がGPU向けに入っている
 これを使っていろいろやってみた
 boost::pythonなんてあるのか

@ponkotuyさん
「GPGPUと流体計算」
 資料はこちら
 GTX680、メモリが削減されている。GK110はこれが改善されている
 1.5TFlops
 流体計算ではシミュレーション領域を矩形に区切る。並列化は簡単。
 
@w_o さん
 「SASSの読み方」
 資料はこちら
 アセンブラ出せるの、知りませんでした。

@fjnli さん
 「NVIDIA GPUのメモリモデルと仲良くなる」
 キャッシュやメモリ階層の話
 Shared Memory、Texture Memory、いろんなメモリ
 Occupancy、スレッドの同時実行性能。Compute Profilerを使うと良い。レイテンシは隠ぺいしやすい。
 Hot Clockはフェルミの後からなくなった。

@foota さん
 TopCoder/NVIDIA主催CUDAプログラミングコンテスト参加記
 CPUとGPUのどちらに処理をやらせるかの切り分けも大事なようです

以下、LT
岡本さん
関西GPGPU勉強会について

おみやげいただきました。
DSC_0237.jpg
また機会があれば、参加したいです。

コメントの投稿

非公開コメント

プロフィール

手ぎつね

Author:手ぎつね
手ぎつねです。
Twitter ID: @_handyfox

サイズを記憶するフォントサイズ変更ボタン
文字を大きくする 文字を規定のサイズに戻す 文字を小さくする
最新記事
最新トラックバック
月別アーカイブ
カテゴリ
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QR