è²¸ã›ã€Runpodã¯Kaggleã§ã“ã†ä½¿ã†

Kaggle - Qiita Advent Calendar 2024 - Qiita 25æ—¥ç›®ã®è¨˜äº‹ã§ã™ã€‚

ã¯ã˜ã‚ã«: Kaggleã«ãŠã‘ã‚‹è¨ˆç®—ãƒªã‚½ãƒ¼ã‚¹ã®é‡è¦æ€§

Kaggleã§ã¯ã€ãƒ‡ãƒ¼ã‚¿ã‚µã‚¤ã‚¨ãƒ³ã‚¹ã®ã‚³ãƒ³ãƒšãƒ†ã‚£ã‚·ãƒ§ãƒ³ãŒé–‹å‚¬ã•ã‚Œã¦ãŠã‚Šã€ãã®å¤šãã¯GPUã‚’ä½¿ã£ãŸè¨ˆç®—ãŒå¿…è¦ã ã€‚ ä¾‹ãˆã°ã€ç”»åƒèªè˜ã®ã‚³ãƒ³ãƒšãƒ†ã‚£ã‚·ãƒ§ãƒ³ã§ã¯ã€ç”»åƒãƒ‡ãƒ¼ã‚¿ã‚’å¦ç¿’ã™ã‚‹ãŸã‚ã«ã€å¤§é‡ã®ç”»åƒãƒ‡ãƒ¼ã‚¿ã‚’GPUã§å¦ç¿’ã™ã‚‹å¿…è¦ãŒã‚ã‚‹ã€‚ ã“ã‚Œã‚‰ã®è¨ˆç®—ã¯ã€ãƒãƒ¼ã‚«ãƒ«ã®PCã§ã¯é›£ã—ã„ãŸã‚ã€ã‚¯ãƒ©ã‚¦ãƒ‰ä¸Šã®è¨ˆç®—ãƒªã‚½ãƒ¼ã‚¹ã‚’åˆ©ç”¨ã™ã‚‹ã“ã¨ãŒä¸€èˆ¬çš„ã ã€‚

ãã—ã¦ã€Kaggleã®ã‚³ãƒ³ãƒšãƒ†ã‚£ã‚·ãƒ§ãƒ³ã«ãŠã„ã¦ã¯ã€è¨ˆç®—ãƒªã‚½ãƒ¼ã‚¹ã®æ€§èƒ½ãŒå‹æ•—ã‚’åˆ†ã‘ã‚‹ã“ã¨ãŒå¤šã„ã€‚ ã¶ã£ã¡ã‚ƒã‘ç§ã®ã‚ˆã†ãªã‚»ãƒ³ã‚¹ã®ãªã„äººé–“ã§ã‚‚ã€å¤šãã®è¨ˆç®—ãƒªã‚½ãƒ¼ã‚¹ã‚’ç¢ºä¿ã—ã€è©¦è¡Œå›žæ•°ã‚’ã¨ã«ã‹ãå¢—ã‚„ã›ã°ã€ä¸Šä½ã«å…¥ã‚‹ç¢ºçŽ‡ãŒé«˜ã¾ã‚‹ã®ã§ã‚ã‚‹ã€‚ (ç«¶ãƒ—ãƒã‚„æ•°å¦ã‚ªãƒªãƒ³ãƒ”ãƒƒã‚¯ã§ã¯ã“ã†ã¯ã„ã‹ãªã„ã€‚è³‡æœ¬ä¸»ç¾©ãƒãƒ³ã‚¶ã‚¤ã€‚)

è¨ˆç®—ãƒªã‚½ãƒ¼ã‚¹ã¨ã—ã¦ã¯ã€AWSã‚„GCPãŒæœ‰åã ãŒã€ã“ã‚Œã‚‰ã¯æ–™é‡‘ãŒé«˜ã„ã€‚ç§ã®ã‚ˆã†ãªè²§æ°‘ãŒã“ã‚Œã‚‰ã‚’å¤šç”¨ã—ã¦ã—ã¾ã£ãŸã‚‰ã€ç ´ç”£å¾…ã£ãŸãªã—ã§ã‚ã‚‹ã€‚(è³‡æœ¬ä¸»ç¾©ãŒæ†Žã„ã€‚) ãã‚“ãªéœ€è¦ã‚’æº€ãŸã™ã‹ã®ã‚ˆã†ã«ã€æ˜¨ä»Šã§ã¯GPUã‚’å°‚é–€ã«å®‰ãæä¾›ã™ã‚‹ã‚µãƒ¼ãƒ“ã‚¹ã‚‚å¢—ãˆã¦ãã¦ã„ã‚‹ã€‚ãã®ä¸ã§ã‚‚Runpodã¯ç‰¹ã«å„ªã‚ŒãŸã‚µãƒ¼ãƒ“ã‚¹ã ã¨æ„Ÿã˜ãŸã€‚

æœ¬ãƒ–ãƒã‚°ã§ã¯ã€Kagglerå‘ã‘ã«ã€Kaggleã«ç‰¹åŒ–ã—ãŸRunpodã®ä½¿ã„æ–¹ã‚„ãã®Tipsã‚’ç´¹ä»‹ã™ã‚‹ã€‚ ã•ã‚‰ã«ã€ç‰¹åˆ¥ã‚²ã‚¹ãƒˆã¨ã—ã¦ã€Kaggle Grandmaster ã§ã‚ã‚‹ã‚¨ãƒãƒ¬ãƒ³( @ethylene_66 ) ã•ã‚“ã‚’ã”æ‹›å¾…ã—ãŸã€‚éŽåŽ»ã‚³ãƒ³ãƒšã§ã©ã®ã‚ˆã†ã«Runpodã‚’ä½¿ã£ã¦ã„ãŸã‹ã€å®Ÿä¾‹ã‚’äº¤ãˆã¦èªžã£ã¦ã„ãŸã ãã€‚

Runpodã®ç´¹ä»‹: ãªãœRunpodã‚’ä½¿ã†ã®ã‹

Runpodã¯ã€ã‚ªãƒ³ãƒ‡ãƒžãƒ³ãƒ‰ã§GPUãƒžã‚·ãƒ³ã‚’åˆ©ç”¨ã§ãã‚‹ã‚¯ãƒ©ã‚¦ãƒ‰ãƒ—ãƒ©ãƒƒãƒˆãƒ•ã‚©ãƒ¼ãƒ ã®ã²ã¨ã¤ã ã€‚ AWSã‚„GCPãªã©ã®å¤§æ‰‹ã‚¯ãƒ©ã‚¦ãƒ‰ã¨æ¯”ã¹ã‚‹ã¨ã€æ‰‹è»½ãªä¾¡æ ¼å¸¯ã‚„ã‚¢ã‚«ã‚¦ãƒ³ãƒˆä½œæˆã€œãƒžã‚·ãƒ³æ§‹ç¯‰ã¾ã§ã®ç°¡å˜ã•ãŒå¤§ããªç‰¹å¾´ã§ã‚ã‚‹ã€‚ã‚¯ãƒ©ã‚¦ãƒ‰çµŒé¨“ãŒæµ…ã„æ–¹ã§ã‚‚å°Žå…¥ã—ã‚„ã™ã„è¨è¨ˆã ã¨æ„Ÿã˜ãŸã€‚ã¾ãŸã€ä»–ã®GPU ã‚¯ãƒ©ã‚¦ãƒ‰ã¨æ¯”ã¹ã¦ã€ã‚¤ãƒ³ã‚¿ãƒ¼ãƒ•ã‚§ã‚¤ã‚¹ãŒã‚ã‹ã‚Šã‚„ã™ãã€Secrets(ãƒžãƒãƒ¼ã‚¸ãƒ‰ãªç’°å¢ƒå¤‰æ•°ç®¡ç†)ãªã©ã®æœ€ä½Žé™ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ãƒªãƒ³ã‚°ã«å¿…è¦ãªæ©Ÿèƒ½ãŒæƒã£ã¦ã„ã‚‹ã®ãŒé…åŠ›ã ã€‚ è¦ç´„ã—ã¦ã—ã¾ãˆã°ã€ã€Žä¾¡æ ¼ãŒå®‰ãã€ä½¿ã„ã‚„ã™ã„ã€ã¨ã„ã†ã®ãŒRunpodã‚’ä½¿ã†ç†ç”±ã ã€‚

ã©ã†ã‚„ã£ã¦Kaggleå‘ã‘ã«Runpodã‚’ä½¿ã£ã¦ã„ãã®ã‹ã€å®Ÿéš›ã«GUIã®æ“ä½œã‚’äº¤ãˆã¦èª¬æ˜Žã—ã¦ã„ã“ã†ã€‚ ä¸€ç·’ã«æ“ä½œã‚’é€²ã‚ã¦ã„ãæ–¹ã¯ã€ã¾ãšä»¥ä¸‹ã®ãƒªãƒ³ã‚¯ã‹ã‚‰Runpodã«ç™»éŒ²ã—ã¦ãŠã“ã†ã€‚

https://runpod.io?ref=6x122dhk ç§ã®ãƒªãƒ•ã‚¡ãƒ©ãƒ«ãƒªãƒ³ã‚¯ã ãŒã€æœ¬è¨˜äº‹ã¸ã®æŠ•ã’éŠä»£ã‚ã‚Šã«ã”ç™»éŒ²ã„ãŸã ã‘ã‚‹ã¨å¬‰ã—ã„ã€‚

ç™»éŒ²ãŒå®Œäº†ã—ãŸã‚‰ã€ä½œæ¥ã‚’é€²ã‚ã‚‹å‰ã«ã‚¯ãƒ¬ã‚¸ãƒƒãƒˆã‚’ãƒãƒ£ãƒ¼ã‚¸ã—ã¦ãŠã“ã†ã€‚Runpodã¯å‰æ‰•ã„åˆ¶ã®ã‚µãƒ¼ãƒ“ã‚¹ã§ã‚ã‚‹(ã‚¯ãƒ©ã‚¦ãƒ‰ç ´ç”£ã‚’å…ã‚Œã‚‹ã®ã§ã‚ã‚ŠãŒãŸã„é™ã‚Šã§ã‚ã‚‹)ã€‚

å¤šåˆ†$10ã‹ã‚‰ãƒãƒ£ãƒ¼ã‚¸ã§ãã‚‹ã€‚

ã¾ãšã¯Storageã‹ã‚‰å§‹ã‚ã‚ˆã†

https://www.runpod.io/console/home ã«ãƒã‚°ã‚¤ãƒ³ã™ã‚‹ã¨ã€GPU Cloud, Serverless, Storage ã®3ã¤ã®é¸æŠžè‚¢ãŒè¡¨ç¤ºã•ã‚Œã‚‹ã€‚

GPU Cloudã¯ã€GPUã‚’ä½¿ã£ãŸè¨ˆç®—ç’°å¢ƒã‚’ãƒ‡ãƒ—ãƒã‚¤ã™ã‚‹ãŸã‚ã®æ©Ÿèƒ½ã ã€‚Kaggleã§ã¯ã“ã®æ©Ÿèƒ½ã‚’ãƒ¡ã‚¤ãƒ³ã«ä½¿ã†ã“ã¨ã«ãªã‚‹ã ã‚ã†ã€‚ Serverlessã¯ã€GPUã‚’ç”¨ã„ãŸã‚µãƒ¼ãƒãƒ¼ãƒ¬ã‚¹ã‚¢ãƒ¼ã‚ãƒ†ã‚¯ãƒãƒ£ã‚’æ§‹ç¯‰ã™ã‚‹ãŸã‚ã®æ©Ÿèƒ½ã ã€‚ä»Šå›žã¯ä½¿ã‚ãªã„ã€‚ Storageã¯ã€è¨ˆç®—ç’°å¢ƒã‹ã‚‰åˆ‡ã‚Šé›¢ã•ã‚ŒãŸæ°¸ç¶šãƒ‡ãƒ¼ã‚¿ã‚’ä¿å˜ã™ã‚‹ãŸã‚ã®æ©Ÿèƒ½ã ã€‚

å®Ÿã¯ä¸€ç•ªã†ã¾ãæ´»ç”¨ã™ã‚‹ã¹ããªã®ã¯ã€Storageæ©Ÿèƒ½ã§ã‚ã‚‹ã€‚ç†ç”±ã¯ã¡ã‚‡ã£ã¨è¤‡é›‘ãªã®ã§ã‚ã¨ã§èª¬æ˜Žã™ã‚‹ã€‚ è‰²ã€…ã¨ä¾¿åˆ©ãªã®ã§ã€ã¾ãšã¯GPU Cloudã‚’ä½¿ã†å‰ã«ã€Storageã‚’ä½œã£ã¦ãŠã“ã†ã€‚

Homeã‹ã‚‰ Storage -> New Network Storage ã‚’ã‚¯ãƒªãƒƒã‚¯ã™ã‚‹ã¨ã€ä»¥ä¸‹ã®ã‚ˆã†ãªç”»é¢ã«ãªã‚‹ã€‚

ã“ã“ã§ã€Storageã‚’ãƒªãƒ¼ã‚¸ãƒ§ãƒ³ã¨ã‚µã‚¤ã‚ºã‚’é¸æŠžã—ã¦ä½œæˆã™ã‚‹ã€‚ãƒªãƒ¼ã‚¸ãƒ§ãƒ³ã«ã‚ˆã£ã¦ã€ä½¿ãˆã‚‹GPUã®ç¨®é¡žãŒç•°ãªã‚‹ã®ã§ä½œæˆã™ã‚‹å‰ã«ã¯ä½¿ã„ãŸã„GPUãŒä½¿ãˆã‚‹ãƒªãƒ¼ã‚¸ãƒ§ãƒ³ãªã®ã‹ã‚’ãƒã‚§ãƒƒã‚¯ã—ã¦ãŠã“ã†ã€‚ ã‚µã‚¤ã‚ºã¯ã€ã‚ã¨ã‹ã‚‰ã§ã‚‚å¢—é‡ã¯ã§ãã‚‹ã®ã§ã€æœ€åˆã¯å°ã•ã‚ã§ã‚‚å•é¡Œãªã„ã€‚ è¨å®šãŒçµ‚ã‚ã£ãŸã‚‰ã€Createã‚’ã‚¯ãƒªãƒƒã‚¯ã—ã¦Storageã‚’ä½œæˆã™ã‚‹ã€‚

ã“ã®å‰æº–å‚™ã‚’ã—ã¦ãŠã„ãŸã»ã†ãŒã‚ˆã„ç†ç”±ã¯ã€æ¬¡ã«GPU Cloudã®ç´¹ä»‹ã‚’ã™ã‚‹éš›ã«ã‚ã‹ã‚‹ã€‚

GPU Cloudã§è¨ˆç®—ç’°å¢ƒã‚’ãƒ‡ãƒ—ãƒã‚¤ã—ã¦ã¿ã‚ˆã†

ã•ã¦ã€ã„ã‚ˆã„ã‚ˆGPU Cloudã‚’ä½¿ã£ã¦è¨ˆç®—ç’°å¢ƒ(Podã¨å‘¼ã°ã‚Œã‚‹)ã‚’ãƒ‡ãƒ—ãƒã‚¤ã—ã¦ã¿ã‚ˆã†ã€‚ å…ˆã»ã©ä½œã£ãŸStorageã®å³ä¸‹ã®Deployãƒœã‚¿ãƒ³ã‚’ã‚¯ãƒªãƒƒã‚¯ã—ã‚ˆã†ã€‚

ã™ã‚‹ã¨ã€GPUã‚’é¸æŠžã—ãŸã‚Šã€Template(è¦ã¯Docker Image)ã‚’é¸æŠžã—ãŸã‚Šã™ã‚‹ç”»é¢ãŒå‡ºã¦ãã‚‹ã€‚ä»Šå›žã¯ã¨ã‚Šã‚ãˆãšã€A100ã®GPUã‚’é¸æŠžã—ã¦é€²ã‚ã¦ã¿ã‚ˆã†ã€‚

Pod Templateã«ã¯Runpod Pytorch 2.1ã‚’é¸ã¶ã“ã¨ã‚’ãŠã™ã™ã‚ã™ã‚‹ã€‚Kaggleã®æŽ¨è«–ç’°å¢ƒã¨Pythonã®ãƒãƒ¼ã‚¸ãƒ§ãƒ³ã€åŠã³ã€Cudaã®ãƒãƒ¼ã‚¸ãƒ§ãƒ³ãŒåˆã£ã¦ã„ã‚‹ãŸã‚ã ã€‚

ä»–ã«ã‚‚

GPUã‚’ã„ãã¤æè¼‰ã™ã‚‹ã‹ï¼Ÿ
é•·æœŸé–“ã®ä½¿ç”¨ã‚’ç´„æŸã™ã‚‹ä»£ã‚ã‚Šã«å‰²å¼•ã‚’é©ç”¨ã™ã‚‹ã‹ï¼Ÿ

ã¨ã„ã£ãŸè¨å®šé …ç›®ãŒã‚ã‚‹ãŒã€å„è‡ªè¨å®šã—ã¦ã»ã—ã„ã€‚ çµŒé¨“ä¸ŠSpotã¯ã™ãã«æ¢ã¾ã‚‹ã®ã§ã€ç§ã¯åŸºæœ¬çš„ã«On-Demandã‚’ä½¿ç”¨ã—ã¦ã„ã‚‹ã€‚

è¨å®šãŒçµ‚ã‚ã£ãŸã‚‰ã€Deployã‚’ã‚¯ãƒªãƒƒã‚¯ã—ã¦Podã‚’ãƒ‡ãƒ—ãƒã‚¤ã—ã‚ˆã†ã€‚

ä»¥ä¸‹ã®ã‚ˆã†ãªç”»é¢ãŒå‡ºã¦ããŸã‚‰ã€Podã®ãƒ‡ãƒ—ãƒã‚¤ãŒå®Œäº†ã ã€‚ã‚ã¨ã¯ã€ã“ã®ç’°å¢ƒä¸Šã§ã€ã‚ãªãŸã®ã‚³ãƒ¼ãƒ‰ã‚’å‹•ã‹ã™ã ã‘ã§ã‚ã‚‹ã€‚Connectã¨æ›¸ã„ã¦ã‚ã‚‹ãƒœã‚¿ãƒ³ã‚’æŠ¼ã›ã°ã€sshæŽ¥ç¶šã«å¿…è¦ãªæƒ…å ±ãŒå‡ºã¦ãã‚‹ã®ã§ã‚ã¨ã¯ç…®ã‚‹ãªã‚Šç„¼ããªã‚Šã ã€‚

ã“ã®è¨ˆç®—ç’°å¢ƒã®ãƒ©ã‚¤ãƒ•ã‚µã‚¤ã‚¯ãƒ«ã¯æŒ™å‹•ãŒç‰¹åˆ¥ãªã®ã§ã€ãã‚Œã‚’èª¬æ˜Žã—ãªã„ã¨ã„ã‘ãªã„ã€‚

ãƒ‡ãƒ—ãƒã‚¤ã•ã‚ŒãŸPodã‚’ä¸€æ™‚åœæ¢(å‡¦ç†çŠ¶æ…‹ã‚’ãã®ã¾ã¾ä¿å˜ã—ã€éžèª²é‡‘çŠ¶æ…‹ã«ç§»è¡Œã™ã‚‹ã“ã¨)ã™ã‚‹ã“ã¨ã¯ã§ããªã„ã€‚åœæ¢ã™ã‚‹å ´åˆã«ã¯ã€ã‚´ãƒŸç®±ã®ã‚¢ã‚¤ã‚³ãƒ³ã‚’æŠ¼ã™ã—ã‹ãªã„ã€‚
/workspaceã«ä¿å˜ã•ã‚ŒãŸãƒ‡ãƒ¼ã‚¿ã¯æ°¸ç¶šåŒ–ã•ã‚Œã‚‹ã€‚ã¤ã¾ã‚Šã€ãã‚Œä»¥å¤–ã®ãƒ‡ã‚£ãƒ¬ã‚¯ã‚¿ã«ä¿å˜ã—ãŸãƒ‡ãƒ¼ã‚¿ã¯Podã‚’çµ‚äº†ã™ã‚‹ã¨æ¶ˆãˆã‚‹ã€‚
/workspaceã«ã¯ã€Storageã§ä½œæˆã—ãŸVolumeãŒãƒžã‚¦ãƒ³ãƒˆã•ã‚Œã¦ã„ã‚‹ã€‚(ã ã‹ã‚‰ã¯ã˜ã‚ã«Storageã§Volumeã‚’ä½œã‚‹å¿…è¦ãŒã‚ã£ãŸã‚“ã§ã™ã)

ã“ã®æŒ™å‹•ã¯ã€Docker Containerã¨æ‰ãˆã‚Œã°ç´ ç›´ãªæŒ™å‹•ã§ã‚ã‚‹ã€‚ãŒã€æ©Ÿæ¢°å¦ç¿’ã¨ã®ç›¸æ€§ã¯æ‚ªã„ã€‚ ãªãœãªã‚‰ã°ã€æ©Ÿæ¢°å¦ç¿’ã§ã¯ã€äº‹å‰å¦ç¿’æ¸ˆã¿ãƒ¢ãƒ‡ãƒ«ã‚’ç”¨ã„ãŸã‚Šã€å¦ç¿’ãƒ‡ãƒ¼ã‚¿ã‚’ç”¨ã„ã‚‹è¨ˆç®—ã‚’ã™ã‚‹ã“ã¨ãŒå¤šã„ã€‚ã•ã‚‰ã«ã¯ã€ä½¿ã†ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã‚‚å¤šãã€ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã®ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã«ã¯æ™‚é–“ãŒã‹ã‹ã‚‹ç‰©ãŒå¤šã„ã‹ã‚‰ã ã€‚ èµ·å‹•ã™ã‚‹ãŸã³ã«ç’°å¢ƒãŒåˆæœŸåŒ–ã•ã‚Œã¦ã—ã¾ã†ä»¥ä¸Šã€åŠ¹çŽ‡çš„ãªæ©Ÿæ¢°å¦ç¿’ç’°å¢ƒã®ã‚»ãƒƒãƒˆã‚¢ãƒƒãƒ—ãŒé‡è¦ã ã€‚ãã®ãŸã‚ã®Tipsã‚’ã€æ¬¡ã®ç« ã§èª¬æ˜Žã—ã¦ã„ã“ã†ã€‚

è£œè¶³:

Storageã‚’ä½¿ã‚ãªãã¦ã‚‚ã€GPU Cloudã§Podã‚’ãƒ‡ãƒ—ãƒã‚¤ã™ã‚‹ã“ã¨ã¯ã§ãã‚‹ã€‚ãã®å ´åˆã€Podã‚’åœæ¢ã™ã‚‹ã“ã¨ã‚‚å¯èƒ½ã¨ãªã‚‹ã€‚ã—ã‹ã—ã€Podã®å®Ÿä½“ã®ãƒžã‚·ãƒ¼ãƒ³ãŒä»–äººã«ä½¿ã‚ã‚Œã¦ã„ã‚‹ã¨ãã«ã€Podã‚’å†é–‹ã™ã‚‹ã“ã¨ãŒã§ããªã„ã€‚ã“ã‚Œã§ã¯ä½¿ã„ãŸã„ã¨ãã«ä½¿ãˆãªã„ã—ã€åœæ¢ä¸ã®Podå†…ã«ã‚ã‚‹ãƒ‡ãƒ¼ã‚¿ã‚’é€€é¿ã•ã›ã‚‹ã“ã¨ã‚‚ã§ããªã„ã€‚ã ã‹ã‚‰åˆæ‰‹Storageã§Volumeã‚’ä½œã‚‹å¿…è¦ãŒã‚ã£ãŸã‚“ã§ã™ãã€‚
Templateã‚’é¸æŠžã—ãŸã‚ã¨ã€Edit Templateã‚’æŠ¼ã™ã¨ã€portã®è¨å®šã‚„ã€ç’°å¢ƒå¤‰æ•°ã®è¨å®šã‚‚ã§ãã‚‹ã€‚ã‚‚ã—å¦ç¿’ãƒã‚°ã®å¯è¦–åŒ–ã«tensorboardã‚’ä½¿ã„ãŸã„å ´åˆã«ã¯ã€å¯¾å¿œã™ã‚‹ç•ªå·ã®portã‚’é–‹ã‘ã¦ãŠãã¨ã‚ˆã„ã ã‚ã†ã€‚ç’°å¢ƒå¤‰æ•°ã«é–¢ã—ã¦ã¯Secretsæ©Ÿèƒ½ã¨æ·±ãé–¢ä¿‚ã™ã‚‹ã®ã§ã€æ¬¡ã®ç« ã§èª¬æ˜Žã™ã‚‹ã€‚

Kaggleå‘ã‘ç’°å¢ƒæ§‹ç¯‰ã®Tips

Runpodã‚’ä½¿ã£ã¦ã€Kaggleå‘ã‘ã®è¨ˆç®—ç’°å¢ƒã‚’æ§‹ç¯‰ã™ã‚‹éš›ã®Tipsã‚’QAå½¢å¼ã§ç´¹ä»‹ã™ã‚‹ã€‚

Q: ä½œæ¥å ´æ‰€ã¯ã©ã“ã«ã™ã‚‹ã¹ãã‹ï¼Ÿ

A: /workspaceã®é…ä¸‹ã«kaggleã‚³ãƒ³ãƒšç”¨ã®ãƒªãƒã‚¸ãƒˆãƒªã‚’é…ç½®ã™ã‚‹ã®ã‚’ãŠã™ã™ã‚ã™ã‚‹ã€‚ãƒ‡ãƒ¼ã‚¿ã‚„ãƒ¢ãƒ‡ãƒ«ç‰ã‚‚ã™ã¹ã¦ã“ã®é…ä¸‹ã«ä¿å˜ã™ã‚‹ã“ã¨ã§ã€Podã‚’å†èµ·å‹•ã—ã¦ã‚‚ãƒ‡ãƒ¼ã‚¿ãŒæ¶ˆãˆãªã„ã‚ˆã†ã«ã™ã‚‹ã€‚

Q: Pythonç’°å¢ƒã¯ï¼Ÿãƒ©ã‚¤ãƒ–ãƒ©ãƒªã®ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã«æ™‚é–“ãŒã‹ã‹ã‚‹ã‚“ã ã‘ã©

A: Kaggleã‚³ãƒ³ãƒšç”¨ã®ãƒªãƒã‚¸ãƒˆãƒªã«Poetryç’°å¢ƒã‚’ä½œæˆã™ã‚‹ã€‚Poetryã§ã¯ãƒªãƒã‚¸ãƒˆãƒªç›´ä¸‹ã®.venv/ã«ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã‚’ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ã™ã‚‹ã®ã§ã€Podã‚’å†èµ·å‹•ã—ã¦ã‚‚ãƒ©ã‚¤ãƒ–ãƒ©ãƒªã®ã‚¤ãƒ³ã‚¹ãƒˆãƒ¼ãƒ«ãŒä¸è¦ã«ãªã‚‹ã€‚ ãªãŠã€ãƒªãƒã‚¸ãƒˆãƒªç›´ä¸‹ã«.venv/ã‚’ä½œæˆã™ã‚‹ãŸã‚ã«ã¯ã€Poetryã®è¨å®šãƒ•ã‚¡ã‚¤ãƒ«pyproject.tomlã«ä»¥ä¸‹ã®è¨å®šã‚’è¿½åŠ ã™ã‚‹å¿…è¦ãŒã‚ã‚‹ã€‚

[tool.poetry]
virtualenvs-in-project = true

Q: VSCodeã§ãƒªãƒ¢ãƒ¼ãƒˆé–‹ç™ºã™ã‚‹ã«ã¯ï¼Ÿ

A: ã“ã‚Œã‚’è¦‹ã‚ã€‚https://docs.runpod.io/tutorials/pods/connect-to-vscode ã“ã‚Œã‚‚è¦‹ã‚ã€‚ https://blog.runpod.io/how-to-connect-vscode-to-runpod/

Q: shellã®ç’°å¢ƒãŒæ¯Žå›žåˆæœŸåŒ–ã•ã‚Œã‚‹ã®ãŒä¸ä¾¿ã ã€‚ã©ã†ã™ã‚Œã°ã„ã„ï¼Ÿ

A: ç’°å¢ƒsetupç”¨ã®shell scriptã‚’ä½œæˆã—ã¾ã—ã‚‡ã†ã€‚ã“ã‚Œã°ã‹ã‚Šã¯ã©ã†ã—ã‚ˆã†ã‚‚ãªã‹ã£ãŸã€‚ ä¾‹ãˆã°ã€ç§ã¯ä»¥ä¸‹ã®ã‚ˆã†ãªã‚¹ã‚¯ãƒªãƒ—ãƒˆã‚’ç”¨ã„ã¦ã„ã‚‹ã€‚PodãŒèµ·å‹•ã—ãŸã‚‰åˆæ‰‹ã§ã“ã‚Œã‚’å®Ÿè¡Œã—ã¦ã„ã‚‹ã€‚

apt update
apt upgrade -y
apt install -y fish tmux htop
pip install poetry kaggle

mkdir ~/.kaggle
echo $RUNPOD_SECRET_kaggle_json > ~/.kaggle/kaggle.json
# ãƒ‘ãƒ¼ãƒŸãƒƒã‚·ãƒ§ãƒ³ã‚’è¨å®š
chmod 600 ~/.kaggle/kaggle.json

git config --global user.email "{githubã®ãƒ¡ã‚¢ãƒ‰}"
git config --global user.name "{githubã®ãƒ¦ãƒ¼ã‚¶å}"

$RUNPOD_SECRET_kaggle_jsonã¯ã€Runpodã®Secretsæ©Ÿèƒ½ã‚’ä½¿ã£ã¦ã€Kaggle APIã®ãƒˆãƒ¼ã‚¯ãƒ³ã‚’è¨å®šã—ã¦ã„ã‚‹ã€‚ èªè¨¼æƒ…å ±ç³»ã¯Secretsæ©Ÿèƒ½ã‚’ä½¿ãˆã°ã€ã‚»ã‚ãƒ¥ã‚¢ã«ç’°å¢ƒå¤‰æ•°ã¨ã—ã¦ç®¡ç†ãƒ»å—ã‘æ¸¡ã—ãŒå¯èƒ½ã ã€‚setupç”¨ã®scriptã«ã‚‚ç°¡å˜ã«çµ„ã¿è¾¼ã‚ã‚‹ãŸã‚ã‚ªã‚¹ã‚¹ãƒ¡ã§ã‚ã‚‹ã€‚

Podã‚’ä½œã‚‹ã¨ãã«ç’°å¢ƒå¤‰æ•°ã®ã¨ã“ã‚ã§ã“ã‚“ãªæ„Ÿã˜ã«æ›¸ã„ã¦ã„ã‚‹ã€‚

A: å¦ç¿’ã«æ¯Žå›žä½¿ã‚ãªã„ã‚‚ã®ã«é–¢ã—ã¦ã¯ã€Google Cloud Storageã«ã‚¢ãƒƒãƒ—ãƒãƒ¼ãƒ‰ã™ã‚‹ã€‚ã¨ã¦ã‚‚å®‰ã„ã€‚

å®Ÿç”¨ä¾‹ by ã‚¨ãƒãƒ¬ãƒ³ã•ã‚“

ã‚ã‚ŠãŒãŸã„ã“ã¨ã« ã€ŒKaggle RunPod éƒ¨ã€ã®ä¸€å“¡ã¨ã—ã¦ä¸€ç« æ›¸ã‹ã›ã¦ã‚‚ã‚‰ãˆã‚‹ã“ã¨ã«ãªã£ãŸã®ã§ã€å¸ƒæ•™ã®ãŸã‚ã«éŽåŽ»ã‚³ãƒ³ãƒšã§ã® RunPod æ´»ç”¨ä¾‹ã«ã¤ã„ã¦ç´¹ä»‹ã•ã›ã¦ã„ãŸã ãã“ã¨ã«ã—ãŸã€‚ ã©ã¡ã‚‰ã‚‚ RunPod ã®ã‚¹ã‚±ãƒ¼ãƒ©ãƒ“ãƒªãƒ†ã‚£ã«åŠ©ã‘ã‚‰ã‚ŒãŸäº‹ä¾‹ã§ã‚ã‚Šã€ã“ã‚Œã‚’ãã£ã‹ã‘ã«~~ç§ãŒä½¿ã†ãŸã‚ã®ã‚¤ãƒ³ã‚¹ã‚¿ãƒ³ã‚¹ã‚’é£Ÿã„å°½ãã•ãªã„ç¨‹åº¦ã«~~ RunPod ä½¿ç”¨è€…ãŒå¢—ãˆã‚‹ã¨å¬‰ã—ã„ã€‚

ã‚³ãƒ³ãƒšå†…å®¹ã‚„è§£æ³•ã®è©³ç´°ã«ã¯è¸ã¿è¾¼ã¾ãªã„ã®ã§ã€ãã¡ã‚‰ãŒæ°—ã«ãªã‚‹æ–¹ã¯ã‚³ãƒ³ãƒšã® Discussion ã‚„ä»–ã®æ–¹ã®è§£æ³•ã¾ã¨ã‚ã‚’å‚ç…§ã—ã¦ã‚‚ã‚‰ã„ãŸã„ã€‚

ã‚³ãƒ³ãƒšå†…å®¹ï¼šç”»åƒã‚»ã‚°ãƒ¡ãƒ³ãƒ†ãƒ¼ã‚·ãƒ§ãƒ³

ã‚³ãƒ³ãƒšã®è§£æ³• : https://www.kaggle.com/competitions/google-research-identify-contrails-reduce-global-warming/discussion/430543

ã‚³ãƒ³ãƒšçµ‚äº†1é€±é–“å‰ã€éŠ€åœä¸Šä½ã‚’ã•ã¾ã‚ˆã£ã¦ã„ãŸã¨ãã€å½“æ™‚ã¯æ³¨ç›®ã•ã‚Œã¦ã„ãªã‹ã£ãŸå¼·ã„ãƒ¢ãƒ‡ãƒ«ã‚’ãƒãƒ¼ãƒ ãƒ¡ã‚¤ãƒˆãŒç™ºè¦‹ã—ãŸãŠã‹ã’ã§é‡‘åœãŒè¦‹ãˆã¦ãã¦ã„ãŸã€‚ ã‚·ãƒ³ã‚°ãƒ«ãƒ¢ãƒ‡ãƒ«ã§éŠ€åœä¸Šä½ã‚’å–ã‚‹ã“ã¨ãŒå¯èƒ½ãªå¼·åŠ›ãªãƒ¢ãƒ‡ãƒ«ã§ã‚ã‚Šãªã‚“ã¨ã—ã¦ã§ã‚‚ã‚¢ãƒ³ã‚µãƒ³ãƒ–ãƒ«ã«çµ„ã¿è¾¼ã¿ãŸã‹ã£ãŸã‚‚ã®ã®ã€learning rate ç‰ã®ãƒã‚¤ãƒ‘ãƒ©èª¿æ•´ãŒé›£ã—ãã€å¦ç¿’ã«åŠæ—¥ã»ã©è¦ã™ã‚‹æ‰‹ã®ã‹ã‹ã‚‹ãƒ¢ãƒ‡ãƒ«ã§ã€æ®‹ã‚Šæ™‚é–“ã§è‰¯ã„ãƒã‚¤ãƒ‘ãƒ©ã‚’å¼•ã‘ã‚‹ã‹ãŒæ€ªã—ã‹ã£ãŸã€‚

ãã“ã§è¨ˆç®—è³‡æºã‚’å¢—ã‚„ã™ãŸã‚ã«ã‚¯ãƒ©ã‚¦ãƒ‰ GPU ã‚µãƒ¼ãƒãƒ¼ã‚’å€Ÿã‚Šã‚‹ã“ã¨ã«ã—ãŸã‚‚ã®ã®ã€GCP/AWS ã¯é«˜ä¾¡ã ã—ã€å®‰ä¾¡ãªã“ã¨ã§æœ‰åãª vast.ai ã¯ã‚¯ãƒ¬ã‚«ãŒé€šã‚‰ãšã€é€”æ–¹ã«ãã‚Œã¦ã„ãŸã€‚ ãƒãƒƒãƒˆã®æµ·ã‹ã‚‰ãªã‚“ã¨ã‹æŽ¢ã—å‡ºã—ãŸ RunPod ã«ã¯ç„¡äº‹ç™»éŒ²ã§ããŸãŸã‚ã€æœ€çµ‚çš„ã«ã¯ã‚¤ãƒ³ã‚¹ã‚¿ãƒ³ã‚¹ã‚’è¤‡æ•°ï¼ˆãŸã—ã‹ RTX 4090 ã¨ A6000 ã‚’ãã‚Œãžã‚Œ2å°ï¼‰ç«‹ã¦ã‚‹ã“ã¨ã§ãƒã‚¤ãƒ‘ãƒ©èª¿æ•´ã¨ 5-fold ã§ã®è¨“ç·´ã‚’ã‚³ãƒ³ãƒšçµ‚äº†å‰ã«å®Œäº†ã§ãã€ç”»åƒã‚³ãƒ³ãƒšã§ã®åˆã®é‡‘ãƒ¡ãƒ€ãƒ«ã‚’ç²å¾—ã—ãŸã€‚

LLM 20 Questions ã‚³ãƒ³ãƒš

ã‚³ãƒ³ãƒšå†…å®¹ï¼š20 Questions ã¨ã„ã†è¨€èªžã‚²ãƒ¼ãƒ ã‚’botåŒå£«ã«æˆ¦ã‚ã›ã‚‹

ã‚³ãƒ³ãƒšã®è§£æ³• : https://www.kaggle.com/competitions/llm-20-questions/discussion/531106

è©³ç´°ã¯çœç•¥ã™ã‚‹ãŒã€è¤‡æ•°ã® 7Bã€œ8B ãƒ¢ãƒ‡ãƒ«ã‚’æ‰‹å…ƒã§ãã‚Œãžã‚Œ 400,000,000 å›žä»¥ä¸ŠæŽ¨è«–ã•ã›ã‚‹å¿…è¦ãŒã‚ã‚‹è§£æ³•ã‚’é¸æŠžã—ãŸãŸã‚ã€è‡ªå®…ã® RTX 4090 1å°ã§ã¯åˆ°åº•è¨ˆç®—ãƒªã‚½ãƒ¼ã‚¹ãŒè¶³ã‚Šãªã‹ã£ãŸã€‚

ãã“ã§ä¾‹ã®ã”ã¨ã RunPod ã§ GPU ã‚¤ãƒ³ã‚¹ã‚¿ãƒ³ã‚¹ã‚’å€Ÿã‚Šã‚‹ã“ã¨ã«ã—ãŸã€‚ ã‚³ãƒ³ãƒšçµ‚äº†2é€±é–“å‰ã§ã®è§£æ³•é¸æŠžã ã£ãŸãŸã‚ã€è´…æ²¢ã« RTX 4090 ãŒ8å°åˆºã•ã£ãŸã‚¤ãƒ³ã‚¹ã‚¿ãƒ³ã‚¹ã‚’å€Ÿã‚Šã‚‹ã“ã¨ã«ã—ãŸã€‚ $3/hour ã§æ¸›ã£ã¦ã„ãæ®‹é«˜ã‚’è¦‹ã‚‹ã®ã¯å¿ƒãŒå‚·ã‚“ã ãŒã€ç„¡äº‹ã«1é€±é–“ç¨‹åº¦ã§å¿…è¦ãªæŽ¨è«–ãŒçµ‚äº†ã—ã€$500ã®æ”¯å‡ºã§æ¸ˆã‚“ã ã€‚ ä»®ã« GCP ã§åŒç¨‹åº¦ã®ã‚¤ãƒ³ã‚¹ã‚¿ãƒ³ã‚¹ã‚’å€Ÿã‚Šã‚ˆã†ã¨ã™ã‚‹ã¨4å€ä»¥ä¸Šã®ä¾¡æ ¼ã®ãŸã‚ã€è»½ç—‡ã§æ¸ˆã‚“ã ã¨ã‚‚è¨€ãˆã‚‹ã€‚~~å„ªå‹è³žé‡‘ã§å›žåŽã§ããŸã‚ã‘ã ã—ã€‚~~

ã¾ã¨ã‚

Runpodã‚’ä½¿ãˆã°ã€å®‰ä¾¡ã‹ã¤æ‰‹è»½ã«GPUãƒªã‚½ãƒ¼ã‚¹ã‚’ç¢ºä¿ã§ãã€Kaggleã®å‹çŽ‡ã‚’å¼•ãä¸Šã’ã‚‹ã“ã¨ãŒã§ãã‚‹ã€‚å¤§æ‰‹ã‚¯ãƒ©ã‚¦ãƒ‰ã«æ¯”ã¹ã¦ç ´ç”£ãƒªã‚¹ã‚¯ãŒå°‘ãªã„ã®ã‚‚è‰¯ã„ç‚¹ã§ã‚ã‚‹ã€‚

æœ¬è¨˜äº‹ã§ã¯ã€Kaggleå‘ã‘ã«Runpodã‚’ä½¿ã†éš›ã®Tipsã‚’ç´¹ä»‹ã—ãŸã€‚ç‰¹ã«ã€Storageã®æ´»ç”¨ã‚„ã€Poetryã‚’ä½¿ã£ãŸPythonç’°å¢ƒã®æ§‹ç¯‰ã€Secretsæ©Ÿèƒ½ã®æ´»ç”¨ãªã©ã¯ã‚ã¾ã‚Šæƒ…å ±ãŒå‡ºå›žã£ã¦ã„ãªã„ã®ã§ã¯ãªã„ã‹ã¨æ€ã†ã®ã§ã€å‚è€ƒã«ã—ã¦ã„ãŸã ã‘ã‚Œã°å¹¸ã„ã§ã‚ã‚‹ã€‚

ã‚‚ã†ä¸€åº¦ãƒªãƒ•ã‚¡ãƒ©ãƒ«ãƒªãƒ³ã‚¯ã‚’è²¼ã£ã¦ãŠãã®ã§ã€ã€ŒKaggle Runpod éƒ¨(?)ã€ã¸ã®å…¥ä¼šã‚’ãŠå¾…ã¡ã—ã¦ã¾ã™ã€‚ https://runpod.io?ref=6x122dhk

Kaggle - Qiita Advent Calendar 2024 - Qiitaã®9æ—¥ç›®ã®è¨˜äº‹ã¯Runpodã®å¯¾æŠ—é¦¬ã§ã‚ã‚‹vast.aiã®è§£èª¬ãŒãªã•ã‚Œã¦ã„ã‚‹ã®ã§ã€èˆˆå‘³ãŒã‚ã‚‹æ–¹ã¯ã“ã¡ã‚‰ã‚‚åˆã‚ã›ã¦å‚ç…§ã•ã‚ŒãŸã„ã€‚

vast.aiでkaggleの環境構築

å¦ç¿’ã™ã‚‹å¤©ç„¶ãƒ‹ãƒ¥ãƒ¼ãƒ©ãƒ«ãƒãƒƒãƒˆ

ä¸»ã«æ©Ÿæ¢°å¦ç¿’ã«é–¢ã™ã‚‹è¦šæ›¸ã‚„æƒ…å ±ã®æ•´ç†ã€‚ç«¶ãƒ—ãƒæ°´è‰²â†’Kaggle Masterâ†’ï¼Ÿ