é–¢æ± GPGPU å‹‰å¼·ä¼šã«è¡Œã£ã¦ãã¾ã—ãŸ

å…ˆæ—¥ã®ã“ã¨ã§ã™ã€‚

å‚åŠ è€…å±¤ãŒåƒ•ã¯ã‚ˆãã‚ã‹ã‚‰ãªã‹ã£ãŸã®ã§ã€å¤šåˆ†å…¥é–€ã¨ã‹ã‚½ãƒ•ãƒˆãªæ„Ÿã˜ã®å‹‰å¼·ä¼šãªã‚“ã ã‚ã†ãªã¨æ€ã£ã¦ TL æµã‚Œã¦ããŸçž¬é–“ã«å‚åŠ ãƒœã‚¿ãƒ³ã‚’æŠ¼ã—ãŸã®ã§ã™ãŒã€ç™ºè¡¨ã‚¿ã‚¤ãƒˆãƒ«ã ã‘è¦‹ã¦éžå¸¸ã«ãƒãƒ¼ãƒ‰ãªã“ã¨ã‚’æ„Ÿã˜ã¾ã—ãŸã€‚å®Ÿéš›ç™ºè¡¨è´ã„ã¦ã¦ãªã‹ãªã‹ãƒãƒ¼ãƒ‰ã§ã—ãŸã€‚

å…¨éƒ¨æ›¸ãã¨é•·ã„ã®ã§å¹¾ã¤ã‹ã€‚

GPGPU DE ã„ã‚ã‚“ãªå•é¡Œã‚’è§£ã„ã¦ã¿ãŸã‚Šã—ãŸ

NVIDIA ã¨ AMD ã® GPU ã§åŒã˜ã‚ˆã†ã«å•é¡Œã‚’è§£ã‹ã›ã¦ã¿ãŸè©±ã€OpenCL ã§ã€‚

OpenCL ã¯ä½¿ã£ãŸã“ã¨ç„¡ã„ã®ã§ãªã‚“ã¨ã‚‚ã„ãˆã¾ã›ã‚“ãŒã€ãªã‚“ã‹ AMD ã®æ–¹ã¯ã‚«ãƒ¼ãƒãƒ«ã‚’èµ·å‹•ã™ã‚‹é€Ÿåº¦ãŒã‚ã¾ã‚Šé€Ÿããªã„ã‚‰ã—ã„ï¼ˆï¼Ÿï¼‰ã®ã§ã‚«ãƒ¼ãƒãƒ«ã‚’è¨ˆç®—ä¸ã«ä½•åº¦ã‚‚èµ·å‹•ã™ã‚‹ã‚ˆã†ãªã‚³ãƒ¼ãƒ‰ã¯é…ããªã‚Šã‚„ã™ã„ã€ã¨ã„ã†ã‚ˆã†ãªçµè«–ã ã£ãŸã¨æ€ã„ã¾ã™ã€‚

ãªã‚“ã‹ GPGPU ã™ã‚‹ãªã‚‰ CUDA ã¿ãŸã„ãªé¢¨æ½®ãŒå¼·ãæ„Ÿã˜ã‚‰ã‚Œã‚‹ã®ã¯ã“ã†ã„ã†ã¨ã“ã‚ã«ã‚‚ã‚ã‚‹ã®ã‹ã‚‚çŸ¥ã‚Œãªã„ãªã€ã¨ã‹å‹æ‰‹ã«æ€ã£ã¦ã¾ã—ãŸã€‚

LLVM meets GPU

CUDA5 ã®ãƒ—ãƒ¬ãƒ“ãƒ¥ãƒ¼ç‰ˆã«ã‚ã‚‹ CUDA Compiler SDK ã‹ã‚‰ LLVM IR ã‚µãƒ–ã‚»ãƒƒãƒˆã§ã‚ã‚‹ NVVM IR ã‚’ä½¿ã£ã¦ä»»æ„ã®è¨€èªžï¼ˆä»Šå›žã¯Pythonï¼‰ã§ CUDA ã‚’å‹•ã‹ã—ã¦ã¿ãŸã¨ã„ã†å†…å®¹ã€‚

å…ˆæ—¥ CUDA5 ã®ãƒ—ãƒ¬ãƒ“ãƒ¥ãƒ¼ç‰ˆã‚’ãƒ€ã‚¦ãƒ³ãƒãƒ¼ãƒ‰ã§ãã‚‹ã‚ˆã†ã«ã—ãŸã®ã§æ˜Žæ—¥ã‚ãŸã‚Šè©¦ãã†ã¨æ€ã†ã®ã§ã™ãŒã€CUDA5 ã‹ã‚‰éžå¸¸ã«å¤¢ãŒåºƒãŒã‚‹ä½•ã‹ã‚’æ„Ÿã˜ã‚‰ã‚Œã¦å¬‰ã—ã„ç™ºè¡¨ã§ã—ãŸã€‚

NVIDIA GPUã®ãƒ¡ãƒ¢ãƒªãƒ¢ãƒ‡ãƒ«ã¨ä»²è‰¯ããªã‚‹

CUDA ã®ãƒ¡ãƒ¢ãƒªãƒ¢ãƒ‡ãƒ«ã¯çµæ§‹ç‰¹æ®Šã§ã€ç”¨é€”ã«åˆã‚ã›ãªã„ã¨ãƒ‘ãƒ•ã‚©ãƒ¼ãƒžãƒ³ã‚¹ãŒå‡ºãªã„ã¨ã„ã†æ‚²ã—ã„ç¾å®ŸãŒã‚ã‚Šã¾ã™ã€‚ãã®è¾ºã®è‰²ã€…ã‚ã‚‹ãƒ¡ãƒ¢ãƒªã®ç¨®é¡žã‚’è§£èª¬ã—ãŸè©±ã€‚

GK110 ã®ãƒ›ãƒ¯ã‚¤ãƒˆãƒšãƒ¼ãƒ‘ãƒ¼æ—¢ã«å‡ºã¦ã„ãŸã“ã¨ãŒã“ã“ã§åˆ†ã‹ã£ãŸã®ã§ã€æ—©é€Ÿãƒ€ã‚¦ãƒ³ãƒãƒ¼ãƒ‰ã—ã¾ã—ãŸãŒã€Hyper-Q ã¨ã‹ Dynamic Parallelism ã¨ã‹ã€Kepler ã®ç›®çŽ‰æ©Ÿèƒ½ã¨ã‹ã¯ GK110 ã˜ã‚ƒãªã„ã¨ã‚µãƒãƒ¼ãƒˆã—ã¦ãªã„ã®ã§ã€å®Ÿè³ªçš„ãª Kepler ä¸–ä»£ã‚¢ãƒ¼ã‚¯ãƒ†ã‚¯ãƒãƒ£ã¯ GK110 ã‹ã‚‰ã¿ãŸã„ãªæ„Ÿã˜ã«ãªã‚‹ã®ã§ã¯ãªã„ã§ã—ã‚‡ã†ã‹ã€‚Compute Capability ã¯ 3.5 ã‚‰ã—ã„ã§ã™ã‘ã©ãã€‚

æ‡‡è¦ªä¼š

å½“æ—¥ã«ãªã£ã¦æ‡‡è¦ªä¼šã®å˜åœ¨ã‚’æŠŠæ¡ã—ãŸã®ã§ã€å‚åŠ ã™ã‚‹ã—ã‹ãªã„ã¨ã„ã†ã“ã¨ã§å‚åŠ ã€‚

ã¾ã‚ãƒ—ãƒã®äººã¨ã‹ã€ä¼šç¤¾ã®äººã¨ã‹å¤šãã¦å¦ç”Ÿèº«åˆ†ã§ãƒ“ã‚¯ãƒ“ã‚¯ã—ã¦ã¾ã—ãŸã€‚

è‰²ã€…æ¨ªã«å±…ãŸå…ˆè¼©ã¨ã‹ã¨ãªãœã‹ C++11 ã®è©±ã‚’ã—ã¦ã„ã¾ã—ãŸãŒã€ãã®å¾Œã¯ @fadis_ ã•ã‚“ @ponkotuy ã•ã‚“ã¨ perl ã®ã‚ˆã†ãªã‚‚ã®ã¨ã‹ã€CUDA ã¨ã‹ã€ã‚ˆãåˆ†ã‹ã‚‰ãªã„é›‘å¤šãªè©±ã¨ã‹ã§ç››ã‚Šä¸ŠãŒã‚Šã¾ã—ãŸã€‚

æ‡‡è¦ªä¼šã§ä¸€ç•ªé©šã„ãŸã®ã¯ã€ä¸»å‚¬ã® @telmin_orca ã•ã‚“ã‹ã‚‰ã€Œé—‡é‹ã®äººã§ã™ã‹ï¼ï¼Ÿã€ã£ã¦è¨€ã‚ã‚ŒãŸã“ã¨ã§ã™ã€‚ãã†ã„ã†é¢¨ã«çŸ¥ã‚‰ã‚Œã¦ã„ãŸã‚Šã‚‚ã™ã‚‹ã®ã‹ã€‚

ä½™è«‡

é—‡é‹ãƒ—ãƒã‚°ãƒ©ãƒŸãƒ³ã‚°å‹‰å¼·ä¼šã®ã“ã¨ã‚’ã€Œãƒ˜ãƒ†ãƒã‚¸ãƒ‹ã‚¢ã‚¹ãªãƒ—ãƒã‚°ãƒ©ãƒŸãƒ³ã‚°å‹‰å¼·ä¼šã€ã¨å‘¼ã¶ã¨ã‹ã£ã“ã‚ˆãè¦‹ãˆã¾ã™ãã€‚

GPGPU DE ã„ã‚ã‚“ãªå•é¡Œã‚’è§£ã„ã¦ã¿ãŸã‚Šã—ãŸ

LLVM meets GPU

NVIDIA GPUã®ãƒ¡ãƒ¢ãƒªãƒ¢ãƒ‡ãƒ«ã¨ä»²è‰¯ããªã‚‹

æ‡‡è¦ªä¼š

ä½™è«‡

GPGPU DE ã„ã‚ã‚“ãªå•é¡Œã‚’è§£ã„ã¦ã¿ãŸã‚Šã—ãŸ

NVIDIA GPUã®ãƒ¡ãƒ¢ãƒªãƒ¢ãƒ‡ãƒ«ã¨ä»²è‰¯ããªã‚‹