[B! gpu] dannã®ãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯

dann id:dann

gpuã«é–¢ã™ã‚‹dannã®ãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯ (149)

${{author_name}}$

{{{comment_expanded}}}

{{label}}

{{#is_bookmark}}ãƒªã‚¹ãƒˆ{{/is_bookmark}}{{^is_bookmark}}ãƒªãƒ³ã‚¯{{/is_bookmark}}

${{author_name}}$
{{author_name}}{{created}}
{{ #comment }}{{ comment }}{{ /comment }}
- {{ label }}

${{author_name}}$

{{{comment_expanded}}}

{{label}}

{{#is_bookmark}}ãƒªã‚¹ãƒˆ{{/is_bookmark}}{{^is_bookmark}}ãƒªãƒ³ã‚¯{{/is_bookmark}}

Ethernetãƒ™ãƒ¼ã‚¹ã®GPUã‚¯ãƒ©ã‚¹ã‚¿å°Žå…¥ã«ã‚ˆã‚‹å¦ã³ã¨å±•æœ›
NVIDIA AI Summit Japan 2024ã«ã¦ç™ºè¡¨ã—ãŸå†…å®¹ã§ã™ã€‚ ç™»å£‡æ—¥ï¼š 2024å¹´11æœˆ13æ—¥ ã‚¤ãƒ™ãƒ³ãƒˆãƒªãƒ³ã‚¯ï¼šÂ https://www.nvidia.com/ja-jp/events/ai-summit/ ç™»å£‡å‹•ç”»ï¼šÂ https://www.nvidia.com/ja-jp/onâ€¦
dann 2024/12/06
network

gpu
ãƒªãƒ³ã‚¯
https://mdx.jp/wp-content/uploads/2022/08/hpc185_sugiki.pdf
dann 2024/10/11
k8s

mellanox

gpu
ãƒªãƒ³ã‚¯
ç”ŸæˆAIå‘ã‘ãƒ‘ãƒ–ãƒªãƒƒã‚¯ã‚¯ãƒ©ã‚¦ãƒ‰ã‚µãƒ¼ãƒ“ã‚¹ã‚’ã¤ãã£ã¦ã¿ãŸè©± | ã•ãã‚‰ã®ãƒŠãƒ¬ãƒƒã‚¸
ã“ã‚“ã«ã¡ã¯ã€‚ã•ãã‚‰ã®ãƒŠãƒ¬ãƒƒã‚¸ç·¨é›†éƒ¨ã§ã™ã€‚ 7æœˆã«é–‹å‚¬ã•ã‚ŒãŸJANOG54 Meetingã§ã€Œç”ŸæˆAIå‘ã‘ãƒ‘ãƒ–ãƒªãƒƒã‚¯ã‚¯ãƒ©ã‚¦ãƒ‰ã‚µãƒ¼ãƒ“ã‚¹ã‚’ã¤ãã£ã¦ã¿ãŸè©±ã€ã«ã¤ã„ã¦ã€ã•ãã‚‰ã‚¤ãƒ³ã‚¿ãƒ¼ãƒãƒƒãƒˆ é«˜å³¯ èª ã•ã‚“ã€äº•ä¸Š å–¬è¦–ã•ã‚“ã€å¹³ç”° å¤§ç¥ã•ã‚“ãŒç™»å£‡ã—ã¾ã—ãŸã€‚ãã®å†…å®¹ã‚’ãƒ¬ãƒãƒ¼ãƒˆã—ã¾ã™ã€‚ ç”ŸæˆAIå‘ã‘åŸºç›¤ã«ã¤ã„ã¦ã€ã¾ãšã¯æ™‚ç³»åˆ—ã‚’ç”¨ã„ã¦æ¦‚è¦ã‚’èª¬æ˜Žã—ã¾ã™ã€‚2011å¹´ã«ã€ã•ãã‚‰ã‚¤ãƒ³ã‚¿ãƒ¼ãƒãƒƒãƒˆã¯åŒ—æµ·é“çŸ³ç‹©ã«è‡ªç¤¾é‹å–¶ã®çŸ³ç‹©ãƒ‡ãƒ¼ã‚¿ã‚»ãƒ³ã‚¿ã‚’é–‹æ‰€ã—ã¾ã—ãŸã€‚2016å¹´9æœˆã«åˆã‚ã¦GPUã®ã‚³ãƒ³ãƒ”ãƒ¥ãƒ¼ãƒ†ã‚£ãƒ³ã‚°ãƒªã‚½ãƒ¼ã‚¹ã‚’æä¾›ã™ã‚‹ã€Œã•ãã‚‰ã®å°‚ç”¨ã‚µãƒ¼ãƒ é«˜ç«åŠ›ã€ã‚·ãƒªãƒ¼ã‚ºã®ã‚µãƒ¼ãƒ“ã‚¹ã‚’é–‹å§‹ã—ã€2020å¹´7æœˆã«ã¯ã•ãã‚‰ã®å°‚ç”¨ã‚µãƒ¼ãƒã®æ–°ã—ã„ãƒãƒƒãƒˆãƒ¯ãƒ¼ã‚¯åŸºç›¤ã€Œã•ãã‚‰ã®å°‚ç”¨ã‚µãƒ¼ãƒ PHYã€ã¨ã„ã†ã‚µãƒ¼ãƒ“ã‚¹ã‚‚æä¾›é–‹å§‹ã—ã¾ã—ãŸã€‚ã•ã‚‰ã«ã€2021å¹´ã«ã¯2016å¹´ã«æä¾›é–‹å§‹ã—ãŸã•ãã‚‰ã®å°‚ç”¨ã‚µãƒ¼ãƒé«˜ç«åŠ›ã®GPUã‚µãƒ¼ãƒã‚’ä»®æƒ³åŒ–ã—ã€ã•ãã‚‰ã®ã‚¯ãƒ©ã‚¦ãƒ‰ã«è¼‰ã›ã‚‹ã€Œã•ãã‚‰ã‚¯
dann 2024/09/29
sakura

network

gpu
ãƒªãƒ³ã‚¯
Data Center Best Practices with DGX B200
dann 2024/07/23
b200

gpu

nvidia
ãƒªãƒ³ã‚¯
CUTLASS Tutorial: Mastering the NVIDIAÂ® Tensor Memory Accelerator (TMA)
dann 2024/06/25
gpu

hopper

performance
ãƒªãƒ³ã‚¯
GitHub - NVIDIA/cuda-samples: Samples for CUDA Developers which demonstrates features in CUDA Toolkit
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
dann 2024/06/25
nvidia

gpu

cuda
ãƒªãƒ³ã‚¯
NVIDIA NIM | nemotron-4-340b-instruct
dann 2024/06/19
gpu

llm
ãƒªãƒ³ã‚¯
Lambda GPU Cloud | Frequently Asked Questions (FAQ)
dann 2024/06/03
lambda

gpu
ãƒªãƒ³ã‚¯
Nvidia-smi
dann 2024/04/24
gpu

nvidia
ãƒªãƒ³ã‚¯
Metaã€è‡ªç¤¾é–‹ç™ºAIãƒãƒƒãƒ—ã€ŒMTIAã€ã®ç¬¬2ä¸–ä»£ã‚’ç™ºè¡¨ã€€å…ˆä»£ã®3å€æ€§èƒ½
ç±³Metaã¯4æœˆ10æ—¥ï¼ˆç¾åœ°æ™‚é–“ï¼‰ã€AIãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°é«˜é€ŸåŒ–ã®ãŸã‚ã®ã‚«ã‚¹ã‚¿ãƒ ãƒãƒƒãƒ—ã€ŒMTIAã€ï¼ˆMeta Training and Inference Acceleratorï¼‰ã®ç¬¬2ä¸–ä»£ã‚’ç™ºè¡¨ã—ãŸã€‚ æ˜¨å¹´5æœˆã«ç™ºè¡¨ã—ãŸMTIAã¯ã€Metaã®Facebookã‚„Instagramã§ã®ãƒ©ãƒ³ã‚ãƒ³ã‚°ãŠã‚ˆã³åºƒå‘Šãƒ¬ã‚³ãƒ¡ãƒ³ãƒ‡ãƒ¼ã‚·ãƒ§ãƒ³æ©Ÿèƒ½ãªã©ã§æœ€é©ã«å‹•ä½œã™ã‚‹ã‚ˆã†è¨è¨ˆã•ã‚Œã¦ã„ã‚‹ã€‚AIã®ãƒˆãƒ¬ãƒ¼ãƒ‹ãƒ³ã‚°ã‚’åŠ¹çŽ‡åŒ–ã—ã€æŽ¨è«–ã‚’å®¹æ˜“ã«ã™ã‚‹ã®ãŒç›®çš„ã ã€‚ ç¬¬2ä¸–ä»£ã®MTIAã¯ã€å…ˆä»£ã®ã‚³ãƒ³ãƒ”ãƒ¥ãƒ¼ãƒ†ã‚£ãƒ³ã‚°å¸¯åŸŸå¹…ã¨ãƒ¡ãƒ¢ãƒªå¸¯åŸŸå¹…ã‚’2å€ä»¥ä¸Šã«æ‹¡å¼µã—ã€ã€Œãƒ¦ãƒ¼ã‚¶ãƒ¼ã«é«˜å“è³ªã®æŽ¨å¥¨ã‚’æä¾›ã™ã‚‹ãƒ©ãƒ³ã‚ãƒ³ã‚°ã¨æŽ¨å¥¨ãƒ¢ãƒ‡ãƒ«ã‚’åŠ¹çŽ‡çš„ã«æä¾›ã™ã‚‹ã‚ˆã†è¨è¨ˆã•ã‚Œã¦ã„ã‚‹ã€ã¨ã„ã†ã€‚åˆæœŸã®ãƒ†ã‚¹ãƒˆçµæžœã§ã¯ã€4ã¤ã®ä¸»è¦ãƒ¢ãƒ‡ãƒ«ã§å…ˆä»£ã¨æ¯”è¼ƒã—ã¦æ€§èƒ½ãŒ3å€å‘ä¸Šã—ãŸã€‚ ä¸€èˆ¬çš„ãªGPUã‚ˆã‚Šå¤§å®¹é‡ã®SRAMã‚’ä½¿ã†ã“ã¨ã§ãƒãƒƒãƒã‚µã‚¤ã‚ºãŒåˆ¶é™ã•ã‚Œã¦ã„ã¦ã‚‚ååˆ†ãªã‚³ãƒ³ãƒ”ãƒ¥ãƒ¼ãƒ†ã‚£ãƒ³ã‚°ã‚’æä¾›ã§ãã‚‹ã€‚
dann 2024/04/12
meta

mita

gpu
ãƒªãƒ³ã‚¯
AMDã€ç”ŸæˆAIã§NVIDIA H100ã‚’ä¸Šå›žã‚‹æ€§èƒ½ã®GPUã€ŒInstinct MI300ã€
dann 2024/04/12
amd

gpu
ãƒªãƒ³ã‚¯
nvidia-blackwell-architecture-technical-brief.pdf
dann 2024/03/20
nvidia

gpu

blackwell
ãƒªãƒ³ã‚¯
NVIDIA A100/H100 ã®L2 Cacheã«ã¤ã„ã¦ã€å†åº¦èª¿ã¹ãŸ - Vengineerã®å¦„æƒ³
ã¯ã˜ã‚ã« NVIDIA A100ã«ã¦ã€L2 Cacheã®æ§‹æˆãŒå¤‰ã‚ã£ãŸã“ã¨ã¯ã€ä¸‹è¨˜ã®ãƒ–ãƒã‚°ã§æ›¸ãã¾ã—ãŸã€‚ vengineer.hatena blog.com ä»Šå›žã¯ã€L2 Cache ã®ã‚µã‚¤ã‚ºãŒã€P100ã®4MBã€V100ã®6MBã‹ã‚‰ A100 ã§ã¯ 40MB (48MB)ã€H100 ã§ã¯ 50MB (60MB) ã«ãªã£ã¦ã€ãã®åˆ©ç”¨ã«ã¤ã„ã¦èª¿ã¹ã¦ã¿ã¾ã—ãŸã€‚ NVIDIA GA100 ã® L2 Cache A100 ã® L2 Cache ã¯ã€40MB (GA100ã§ã¯ 48MB ã§ã™ãŒã€A100 ã¨ã—ã¦ã¯ 40MB ã—ã‹ä½¿ãˆã¾ã›ã‚“) ã¨ã€V100 ã® 6MB ã‹ã‚‰ å¤§ããå¢—ãˆã¾ã—ãŸã€‚ å‰å›žã®ãƒ–ãƒã‚°ã§æ›¸ã„ãŸã‚ˆã†ã«ã€GA100 ã® L2 Cacheã¯2ã¤ã®ãƒ–ãƒãƒƒã‚¯ã«åˆ†å‰²ã•ã‚Œã€å„ãƒ–ãƒãƒƒã‚¯ã¯ 20MBã€‚20MB ã¯ã€512KB x 40 å€‹ã¨ã„ã†æ§‹æˆã«ãªã£ã¦ã„ã¾ã™ã€‚ GA100ã¯ã€6å€‹ã®HBM2e ãŒ
dann 2024/02/09
nvidia

gpu
ãƒªãƒ³ã‚¯
https://mpls.jp/2023/presentations/mpls2023-yuyarin.pdf
dann 2024/01/17
gpu

network
ãƒªãƒ³ã‚¯
ã€Œ100fpsä»¥ä¸Šã‚‚å¯èƒ½ã€çˆ†é€Ÿã™ãŽã‚‹ç”»åƒç”ŸæˆAIæŠ€è¡“ã€æ—¥æœ¬äººç ”ç©¶è€…ã‚‰é–‹ç™º
AITuberã€Œã—ãšãã€é–‹ç™ºè€…ã¨ã—ã¦ã‚‚çŸ¥ã‚‰ã‚Œã‚‹ã€ã‚ãå…ˆç”Ÿã“ã¨akio kodairaæ°ã‚’ç†é ã«ã—ãŸç ”ç©¶ã‚°ãƒ«ãƒ¼ãƒ—ã¯12æœˆ21æ—¥ã€ãƒªã‚¢ãƒ«ã‚¿ã‚¤ãƒ ç”»åƒç”Ÿæˆã‚’å®Ÿç¾ã™ã‚‹ãŸã‚ã«æœ€é©åŒ–ã•ã‚ŒãŸãƒ‘ã‚¤ãƒ—ãƒ©ã‚¤ãƒ³ã€ŒStreamDiffusionã€ã‚’ç™ºè¡¨ã€‚å¾“æ¥ã®ç”»åƒç”Ÿæˆãƒ‘ã‚¤ãƒ—ãƒ©ã‚¤ãƒ³ã¨æ¯”ã¹ã¦é£›èºçš„ãªé€Ÿåº¦å‘ä¸Šã‚’å®Ÿç¾ã—ã¦ã„ã‚‹ã€‚ ãƒŽã‚¤ã‚ºé™¤åŽ»ã‚’ãƒãƒƒãƒå‡¦ç†ã§é«˜é€ŸåŒ– ã€ŒStable Diffusionã€ã‚’ã¯ã˜ã‚ã¨ã™ã‚‹ç”»åƒç”ŸæˆAIãƒ¢ãƒ‡ãƒ«ã®é«˜æ€§èƒ½åŒ–ã¯è‘—ã—ã„ãŒã€ãƒ¡ã‚¿ãƒãƒ¼ã‚¹ã€ã‚ªãƒ³ãƒ©ã‚¤ãƒ³ã‚¹ãƒˆãƒªãƒ¼ãƒŸãƒ³ã‚°ãªã©é«˜ã‚¹ãƒ«ãƒ¼ãƒ—ãƒƒãƒˆã¨ä½Žãƒ¬ã‚¤ãƒ†ãƒ³ã‚·ãƒ¼ãŒå¿…è¦ãªç’°å¢ƒã§ã¯ã¾ã åŠ›ä¸è¶³ã ã€‚ StreamDiffusionã¯æ–°ã—ã„ã‚¢ãƒ—ãƒãƒ¼ãƒã‚’æŽ¡ç”¨ã—ã€å¾“æ¥ã®é€£ç¶šçš„ãªãƒŽã‚¤ã‚ºé™¤åŽ»ã‚’ãƒãƒƒãƒå‡¦ç†ã®ãƒ—ãƒã‚»ã‚¹ã«å¤‰æ›ã™ã‚‹ã“ã¨ã§ã€é«˜ã‚¹ãƒ«ãƒ¼ãƒ—ãƒƒãƒˆã‚¹ãƒˆãƒªãƒ¼ãƒ ã‚’å®Ÿç¾ã€‚ã•ã‚‰ã«ã€GPUã®åˆ©ç”¨åŠ¹çŽ‡ã‚’å‘ä¸Šã•ã›ã‚‹ãŸã‚ã€å¾“æ¥ã®åˆ†é¡žå™¨ãƒ•ãƒªãƒ¼ã‚¬ã‚¤ãƒ€ãƒ³ã‚¹ï¼ˆCFGï¼‰ã«ä»£ã‚ã‚Šã€æ®‹å·®åˆ†é¡žå™¨ãƒ•ãƒªãƒ¼ã‚¬ã‚¤ãƒ€ãƒ³ã‚¹ï¼ˆRCFG
dann 2023/12/22
ai

gpu
ãƒªãƒ³ã‚¯
Fireworks - Fastest Inference for Generative AI
Go from hype to high-value AI Go from generic to specialized AI Go from single model to compound AI Go from prototype to production AIThe fastest and most efficient inference engine to build production-ready, compound AI systems.
dann 2023/12/02
performance

gpu

cudagraph
ãƒªãƒ³ã‚¯
A Look at the Liquid Cooled Supermicro SYS-821GE-TNHR 8x NVIDIA H100 AI Server
dann 2023/11/02
h100

gpu

nvidia
ãƒªãƒ³ã‚¯
DGX H100ã¯ä½•ãŒå¤‰ã‚ã£ãŸã®ã‹ï¼Ÿ | HPCã‚·ã‚¹ãƒ†ãƒ ã‚º Tech Blog
ä¸Šè¨˜ã®è¡¨ã®ã€Œã‚±ãƒ¼ã‚¸æ•°ã€ã¨ã¯ã€èƒŒé¢ã«ã‚ã‚‹cluster networkç”¨ã®é€šä¿¡ãƒãƒ¼ãƒˆã®å£æ•°ã‚’è¡¨ã—ã¦ã„ã¾ã™ã€‚ DGX H100ã§æŽ¡ç”¨ã•ã‚ŒãŸtwin port OSFPã¯ã€çä½“å†…éƒ¨ã§2ã¤ã®ConnectX-7(400Gbps)ã«æŽ¥ç¶šã™ã‚‹æ§‹é€ ã¨ãªã£ã¦ãŠã‚Šã€ï¼‘ã¤ã®ãƒˆãƒ©ãƒ³ã‚·ãƒ¼ãƒã«ï¼’æœ¬ã®ã‚±ãƒ¼ãƒ–ãƒ«ã‚’æŒ¿ã—ã¦é‹ç”¨ã—ã¾ã™ã€‚ãã®ãŸã‚ã€ãƒãƒ¼ãƒˆæ•°ã¯ã‚±ãƒ¼ã‚¸æ•°ã®2å€ã¨ãªã‚Šã¾ã™ã€‚twin port OSFPã‚’æŽ¡ç”¨ã—ãŸã“ã¨ã§ã€DGX A100ã§ã¯ã‚µãƒ¼ãƒãƒ¼èƒŒé¢ã®ç´„åŠåˆ†ã‚’å ã‚ã¦ã„ãŸcluster networkéƒ¨åˆ†ãŒã€DGX H100ã§ã¯ã‚µãƒ¼ãƒãƒ¼èƒŒé¢ã®ä¸å¿ƒéƒ¨åˆ†ã«åŽã¾ã‚‹ã‚ˆã†ã«ãªã‚Šã¾ã—ãŸã€‚ ã—ã°ã—ã°ã€ã€Œ1ã¤ã®OSFPãƒˆãƒ©ãƒ³ã‚·ãƒ¼ãƒã‚’ä½¿ã£ã¦800Gbpsã§é€šä¿¡ã§ãã‚‹ã€ã¨ã„ã†è¨˜è¿°ãŒã•ã‚Œã¾ã™ãŒã€ã“ã‚Œã¯å˜ã«é€šä¿¡å¸¯åŸŸã‚’è¶³ã—åˆã‚ã›ãŸæ•°å€¤ã«éŽãŽãšã€DGXã‚µãƒ¼ãƒãƒ¼é–“ã®GPUé€šä¿¡ãŒ800Gbpsã§è¡Œãˆã‚‹ã¨ã„ã†æ„å‘³ã§ã¯ã‚ã‚Šã¾ã›ã‚“ã®ã§æ³¨æ„ã—ã¦ãã ã•ã„ã€‚ c
dann 2023/09/24
gpu

network

nvidia

dgx
ãƒªãƒ³ã‚¯
GitHub - NVIDIA/Fuser: A Fusion Code Generator for NVIDIA GPUs (commonly known as "nvFuser")
dann 2023/06/26
nvidia

gpu
ãƒªãƒ³ã‚¯
NVIDIA Deep Learning Performance - NVIDIA Docs
NVIDIA Deep Learning Performance Documentation - Last updated February 1, 2023 Get Started With Deep Learning Performance This is the landing page for our deep learning performance documentation. This page provides recommendations that apply to most deep learning operations. It also provides links, short explanations of other performance documents, and how these pages fit together. Training Train
dann 2023/06/20
nvidia

gpu

performance
ãƒªãƒ³ã‚¯
1 2 3 4 5 6 7 8 æ¬¡ã®ãƒšãƒ¼ã‚¸