è©•ä¾¡é§†å‹•é–‹ç™ºï¼ˆEval-driven developmentï¼‰ï¼šLLMã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³é–‹ç™ºã«ãŠã‘ã‚‹èª²é¡Œã¨ã‚¢ãƒ—ãƒãƒ¼ãƒ

ã“ã®è¨˜äº‹ã¯ã€LayerX Tech Advent Calendar 2024 ã® 12æ—¥ç›®ã®è¨˜äº‹ã§ã™ã€‚

tech.layerx.co.jp

ã“ã‚“ã«ã¡ã¯ã€LayerXã®AIãƒ»LLMäº‹æ¥éƒ¨ãƒ—ãƒãƒ€ã‚¯ãƒˆãƒžãƒãƒ¼ã‚¸ãƒ£ãƒ¼ã®é‡Žç•‘(@isseinohata)ã§ã™ã€‚

AIãƒ»LLMäº‹æ¥éƒ¨ã§ã¯ç”ŸæˆAIãƒ—ãƒ©ãƒƒãƒˆãƒ•ã‚©ãƒ¼ãƒ ã€ŒAi Workforceã€ã‚’é–‹ç™ºã—ã¦ã„ã¾ã™ã€‚

LLMã‚’ç”¨ã„ãŸã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³é–‹ç™ºã«ã¯ç‹¬è‡ªã®ç‰¹å¾´ã‚„èª²é¡ŒãŒå˜åœ¨ã—ã¦ãŠã‚Šã€Ai Workforceã®é–‹ç™ºãƒãƒ¼ãƒ ã‚‚ã€æ—¥ã€…æ§˜ã€…ãªãƒãƒ£ãƒ¬ãƒ³ã‚¸ã«å‘ãåˆã£ã¦ã„ã¾ã™ã€‚ä»Šå›žã¯ã€ãã®ä¸ã§ã‚‚ç‰¹ã«LLMã®ã€Œå‡ºåŠ›ã®ä¸ç¢ºå®šã•ã€ã«èµ·å› ã™ã‚‹é–‹ç™ºãƒ—ãƒã‚»ã‚¹ã®èª²é¡Œã‚’è§£æ±ºã™ã‚‹ãŸã‚ã®æ–¹æ³•ã¨ã—ã¦ã€è©•ä¾¡é§†å‹•é–‹ç™ºã¨ã„ã†ã‚¢ãƒ—ãƒãƒ¼ãƒã‚’ã”ç´¹ä»‹ã—ã¾ã™ã€‚

è©•ä¾¡é§†å‹•é–‹ç™ºã‚’ç´¹ä»‹ã™ã‚‹å‰ã«ã€LLMã‚’ã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã«çµ„ã¿è¾¼ã‚€ä¸Šã§ã®ç‰¹å¾´ã‚„èª²é¡Œã«ã¤ã„ã¦ã€ç°¡å˜ã«ã¾ã¨ã‚ã¦ã¿ã¾ã™ã€‚

LLMã‚’ç”¨ã„ãŸã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³é–‹ç™ºã®ç‰¹å¾´

1. ç²¾åº¦å‘ä¸Šã®ãŸã‚ã®ãƒ—ãƒã‚»ã‚¹è¨è¨ˆã¨ãƒ‰ãƒ¡ã‚¤ãƒ³çŸ¥è˜ã®æ‹¡å……

æ¥å‹™ã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ç‰ã§æ¯”è¼ƒçš„è¤‡é›‘æ€§ã®é«˜ã„å‡¦ç†ã‚’AIã§è‡ªå‹•åŒ–ã™ã‚‹ã‚±ãƒ¼ã‚¹ã«ã—ã¦ã‚‚ã€ãƒãƒ£ãƒƒãƒˆåž‹ã®æ±Žç”¨çš„ãªæ¥å‹™ã‚¢ã‚·ã‚¹ã‚¿ãƒ³ãƒˆã€RAGã‚·ã‚¹ãƒ†ãƒ ã€AIã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆç‰ã®é–‹ç™ºã‚’é€²ã‚ã‚‹ã‚±ãƒ¼ã‚¹ã«ã—ã¦ã‚‚ã€LLMã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã®æ§‹ç¯‰ã«ãŠã„ã¦ã¯LLMã®å‡¦ç†ãƒ—ãƒã‚»ã‚¹ã®è¨è¨ˆã¨ãƒ‰ãƒ¡ã‚¤ãƒ³çŸ¥è˜ã®æ‹¡å……ãŒã‚·ã‚¹ãƒ†ãƒ ã®æ€§èƒ½ã‚’å¤§ããå·¦å³ã—ã¾ã™ã€‚

ç‰¹ã«è¤‡é›‘ãªæ¥å‹™ã‚’å®‰å®šçš„ã«è§£æ±ºã™ã‚‹ã“ã¨ãŒæ±‚ã‚ã‚‰ã‚Œã‚‹ã‚±ãƒ¼ã‚¹ã§ã¯ã€ã‚¿ã‚¹ã‚¯ã®åˆ†å‰²ã«ã‚ˆã£ã¦LLMãŒè§£ãã‚„ã™ã„ç²’åº¦ã®å•é¡Œã«è½ã¨ã—è¾¼ã¿ã€ãƒ‰ãƒ¡ã‚¤ãƒ³çŸ¥è˜ã‚„ã‚³ãƒ³ãƒ†ã‚ã‚¹ãƒˆã‚’ä¸è¶³ãªãä¸Žãˆã‚‹ã“ã¨ã«ã‚ˆã£ã¦å®Ÿç”¨åŒ–ãƒ¬ãƒ™ãƒ«ã®ç²¾åº¦ã‚’å‡ºã™ã“ã¨ãŒå¯èƒ½ã«ãªã‚Šã¾ã™ã€‚

Beyond PoC〜LLMを本番業務で適用するためにLayerXで取り組んでいること〜 - Speaker Deck

ä¸€æ–¹ã§AIã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã‚„RAGã‚·ã‚¹ãƒ†ãƒ ã®ã‚ˆã†ã«æ¯”è¼ƒçš„æ±Žç”¨æ€§ã‚„ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ãƒ†ã‚£ãƒ–æ€§ãŒæ±‚ã‚ã‚‰ã‚Œã‚‹ç”¨é€”ã§ã‚ã‚Œã°ã€å€‹åˆ¥ã®ã‚¿ã‚¹ã‚¯ã‚’åˆ†è§£ã™ã‚‹ã®ã§ã¯ãªãã€ã‚ˆã‚ŠæŠ½è±¡çš„ãªã€äººé–“ã®åŸºç¤Žçš„ãªèªçŸ¥ãƒ»æŽ¨è«–èƒ½åŠ›ã«è¿‘ã„æ©Ÿæ§‹ã‚’å®šç¾©ã—ã€ãã®çµ„ã¿åˆã‚ã›ã¨ã—ã¦ãƒ—ãƒã‚»ã‚¹ã®æ§‹ç¯‰ãƒ»æœ€é©åŒ–ã‚’ã™ã‚‹ã“ã¨ãŒé‡è¦ã¨ãªã‚Šã¾ã™ã€‚

ã„ãšã‚Œã®ã‚±ãƒ¼ã‚¹ã§ã‚‚ãƒ¦ãƒ¼ã‚¹ã‚±ãƒ¼ã‚¹ã«åˆã‚ã›ãŸãƒ—ãƒã‚»ã‚¹ã®è¨è¨ˆã¨ã€ãƒ‰ãƒ¡ã‚¤ãƒ³æƒ…å ±ã®å–ã‚Šè¾¼ã¾ã›æ–¹ï¼ˆäº‹å‰ã«ãƒãƒ¥ãƒ¼ãƒ‹ãƒ³ã‚°ã™ã‚‹ã‹ã€ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ãƒ†ã‚£ãƒ–ãªä½“é¨“ã®ä¸ã§å¸åŽã•ã›ã‚‹ã‹ï¼‰ãŒã€LLMã‚’å®Ÿç”¨ãƒ¬ãƒ™ãƒ«ã§ã‚·ã‚¹ãƒ†ãƒ ã«çµ„ã¿è¾¼ã‚€ä¸Šã§ã¯ä¸å¿ƒçš„ãªè¦ç´ ã¨ãªã‚‹ã¨æ€ã„ã¾ã™ã€‚

2. ã‚³ã‚¹ãƒˆã€æ™‚é–“ã€ç²¾åº¦ã®ãƒãƒ©ãƒ³ã‚¹ã¨UXã®å·¥å¤«ã«ã‚ˆã‚‹ãƒˆãƒ¬ãƒ¼ãƒ‰ã‚ªãƒ•è‡ªä½“ã®è§£æ¶ˆ

å‡¦ç†ãƒ—ãƒã‚»ã‚¹ã®è¤‡é›‘åŒ–ã¯è¨ˆç®—ã‚³ã‚¹ãƒˆã‚„å‡¦ç†æ™‚é–“ã®å¢—åŠ ã‚’æ‹›ããŸã‚ã€ã‚·ã‚¹ãƒ†ãƒ ã®æ€§èƒ½å‘ä¸Šã¨ã®é–“ã§ãƒˆãƒ¬ãƒ¼ãƒ‰ã‚ªãƒ•ã®é–¢ä¿‚ã«ã‚ã‚Šã¾ã™ã€‚ç‰¹ã«LLMã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã§ã¯å‡¦ç†ãƒ•ãƒãƒ¼ã‚„å„ã‚¹ãƒ†ãƒƒãƒ—ã®æŠœæœ¬çš„ãªæ”¹ä¿®ã«ã‚ˆã£ã¦ãƒ¦ãƒ¼ã‚¶ãƒ¼ã¸ã®æä¾›ä¾¡å€¤ãŒå¤§å¹…ã«å‘ä¸Šã™ã‚‹å ´åˆãŒã‚ã‚‹ãŸã‚ã€å±€æ‰€çš„ãªæœ€é©åŒ–ã«ç¸›ã‚‰ã‚Œã‚‹ã®ã§ã¯ãªãã€ã‚¢ã‚¦ãƒˆã‚«ãƒ è‡ªä½“ã®æ‹¡å¤§å¯èƒ½æ€§ã‚‚å«ã‚ã¦æŽ¢ç´¢ã—ã¦ã„ãã“ã¨ãŒé‡è¦ã¨ãªã‚Šã¾ã™ã€‚

ã¾ãŸã€å‡¦ç†æ™‚é–“ã«å¯¾ã™ã‚‹ãƒ¦ãƒ¼ã‚¶ãƒ¼ã®æ„Ÿã˜æ–¹ã¯ã€é€”ä¸å‡ºåŠ›ã®è¦‹ã›æ–¹ã‚„ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ã‚·ãƒ§ãƒ³ã®è¨è¨ˆã«ã‚ˆã£ã¦ã‚‚å¤§ããå¤‰ã‚ã‚Šã¾ã™ã€‚ä¾‹ãˆã°ã€ãƒ—ãƒã‚»ã‚¹ã®é€²æ—çŠ¶æ³ã‚’æ˜Žç¢ºã«ç¤ºã—ãŸã‚Šã€é€”ä¸ã§å¾—ã‚‰ã‚Œã‚‹éƒ¨åˆ†çš„ãªçµæžœã‚’é€æ¬¡æç¤ºã™ã‚‹ã“ã¨ã§ã€æœ€çµ‚çš„ãªã‚¢ã‚¦ãƒˆãƒ—ãƒƒãƒˆãŒå¾—ã‚‰ã‚Œã‚‹ã¾ã§ã®ãƒ¦ãƒ¼ã‚¶ãƒ¼ã®ä½“æ„Ÿé€Ÿåº¦ã‚’æ”¹å–„ã™ã‚‹ã“ã¨ãŒå¯èƒ½ã§ã™ã€‚

ãã®ãŸã‚ã€å˜ç´”ã«ã‚³ã‚¹ãƒˆã€æ™‚é–“ã€ç²¾åº¦ã®ãƒˆãƒ¬ãƒ¼ãƒ‰ã‚ªãƒ•ã®ä¸ã§æœ€é©åŒ–ã‚’å›³ã‚‹ã ã‘ã§ãªãã€ãƒ¦ãƒ¼ã‚¶ãƒ¼ä½“é¨“ã®å·¥å¤«ã‚„ã‚¢ãƒ¼ã‚ãƒ†ã‚¯ãƒãƒ£ã®æŠœæœ¬çš„ãªæ”¹å–„ã‚’é€šã˜ã¦ã€å…¨ä½“ã®ãƒãƒ©ãƒ³ã‚¹ã‚’ã¨ã‚Šã¤ã¤æä¾›ä¾¡å€¤ã®æ‹¡å¤§ã‚’é€²ã‚ã¦ã„ãã“ã¨ã«ãªã‚Šã¾ã™ã€‚

LLMã‚’ç”¨ã„ãŸãƒ—ãƒãƒ€ã‚¯ãƒˆé–‹ç™ºã®èª²é¡Œ

LLMã‚’ç”¨ã„ãŸãƒ—ãƒãƒ€ã‚¯ãƒˆé–‹ç™ºç‰¹æœ‰ã®èª²é¡Œã¨ã—ã¦ã€LLMã®å‡ºåŠ›ãŒç¢ºçŽ‡çš„ã§ä¸ç¢ºå®šã•ã‚’ä¼´ã†ç‚¹ã¯ã‚ˆãæŒ‡æ‘˜ã•ã‚Œã¾ã™ãŒã€å‰è¿°ã®è¦³ç‚¹ã«æ²¿ã£ã¦æ§˜ã€…ãªã‚¿ã‚¹ã‚¯åˆ†å‰²ã‚„æŠ½è±¡çš„ãªå‡¦ç†æ©Ÿæ§‹ã‚’çµ„ã¿åˆã‚ã›ãŸè¤‡é›‘ãªã‚¢ãƒ¼ã‚ãƒ†ã‚¯ãƒãƒ£ã‚’æ§‹ç¯‰ã™ã‚‹ã¨ã€ç¢ºçŽ‡çš„ãªè¦ç´ ãŒçµ¡ã¿åˆã†ã“ã¨ã§å…¨ä½“ã®ä¸ç¢ºå®šã•ãŒã•ã‚‰ã«å¢—åŠ ã—ã¾ã™ã€‚

ãã®çµæžœã€ãƒ—ãƒã‚»ã‚¹ã®çµ„ã¿æ›¿ãˆã‚„æ–°ã—ã„ã‚¿ã‚¹ã‚¯ãƒ»æ©Ÿæ§‹ã®å°Žå…¥ã€å„ã‚¿ã‚¹ã‚¯ã«ãŠã‘ã‚‹ãƒ—ãƒãƒ³ãƒ—ãƒˆã®æ”¹å–„ãªã©ã€ã‚ã‚‰ã‚†ã‚‹ã‚¿ã‚¤ãƒ—ã®å¤‰æ›´ãŒã‚·ã‚¹ãƒ†ãƒ å…¨ä½“ã®ãƒ‘ãƒ•ã‚©ãƒ¼ãƒžãƒ³ã‚¹ã«ã©ã®ã‚ˆã†ãªå½±éŸ¿ã‚’åŠã¼ã™ã‹ã‚’æŠŠæ¡ã—ãã‚Œãªããªã‚‹å•é¡ŒãŒç™ºç”Ÿã—ã¾ã™ã€‚

Ai Workforceã®é–‹ç™ºã«ãŠã„ã¦ã‚‚ã€æ—¥ã€…ç™ºè¦‹ã•ã‚Œã‚‹èª²é¡Œã«å¯¾ã—ã¦ã•ã¾ã–ã¾ãªæ”¹å–„æ–½ç–ã‚’æ‰“ã¤ã‚‚ã®ã®ã€ãã‚Œã‚‰ã®æ–½ç–ãŒä»–ã«ã©ã®ã‚ˆã†ãªå½±éŸ¿ã‚’åŠã¼ã™ã®ã‹ã‚’æŠŠæ¡ã—ãã‚Œãšã€ã‚¢ã‚¦ãƒˆã‚«ãƒ ã®æ‹¡å¤§ã‚„ãƒˆãƒ¬ãƒ¼ãƒ‰ã‚ªãƒ•ã®æœ€é©åŒ–ã‚’ç›®çš„ã«ãƒ—ãƒãƒ€ã‚¯ãƒˆè‡ªä½“ã®æ”¹å–„ã‚µã‚¤ã‚¯ãƒ«ã‚’å›žã™è¦³ç‚¹ã§ã‚‚ã€ãƒ—ãƒãƒ€ã‚¯ã‚·ãƒ§ãƒ³ãƒªãƒªãƒ¼ã‚¹æ™‚ã®å“è³ªä¿è¨¼ã®è¦³ç‚¹ã§ã‚‚å¤§ããªè¶³æž·ã¨ãªã£ã¦ã„ã¾ã—ãŸã€‚

è©•ä¾¡é§†å‹•é–‹ç™ºï¼ˆEval-driven development ï¼‰ã®å°Žå…¥

ã“ã®ã‚ˆã†ãªLLMç‰¹æœ‰ã®ä¸ç¢ºå®šã•ã«èµ·å› ã™ã‚‹é–‹ç™ºãƒ—ãƒã‚»ã‚¹ã®èª²é¡Œã«å¯¾ã™ã‚‹è§£æ±ºç–ã¨ã—ã¦æ³¨ç›®ã•ã‚Œã¦ã„ã‚‹ã®ãŒã€è©•ä¾¡é§†å‹•é–‹ç™ºï¼ˆEval-driven developmentï¼‰ã§ã™ã€‚

è©•ä¾¡é§†å‹•é–‹ç™ºã¨ã¯ç”ŸæˆAIã‚„LLMã‚’æ´»ç”¨ã—ãŸã‚·ã‚¹ãƒ†ãƒ é–‹ç™ºã«ãŠã„ã¦ã€ã‚·ã‚¹ãƒ†ãƒ ã®å‡ºåŠ›ã®è©•ä¾¡ï¼ˆevaluationï¼‰ã‚’ä¸å¿ƒã«è¨è¨ˆã€é–‹ç™ºã€æ”¹å–„ã®é–‹ç™ºãƒ—ãƒã‚»ã‚¹ã‚’å›žã™æ‰‹æ³•ã§ã™ã€‚

å¾“æ¥ã®ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢é–‹ç™ºã«ãŠã‘ã‚‹ãƒ†ã‚¹ãƒˆé§†å‹•é–‹ç™ºï¼ˆTDDï¼‰ã®æ¦‚å¿µã¨åŸºæœ¬çš„ã«ã¯åŒã˜ã§ã™ãŒã€ãƒ†ã‚¹ãƒˆé§†å‹•é–‹ç™ºãŒäºˆæ¸¬å¯èƒ½ãªã‚·ã‚¹ãƒ†ãƒ ã«é©ã—ã¦ã„ã‚‹ã®ã«å¯¾ã—ã€è©•ä¾¡é§†å‹•é–‹ç™ºã¯LLMãªã‚‰ã§ã¯ã®ç¢ºçŽ‡çš„ãªæŒ¯ã‚‹èˆžã„ã‚„è‡ªç„¶è¨€èªžã«ã‚ˆã‚‹å…¥å‡ºåŠ›ã®å“è³ªã‚’ç¶™ç¶šçš„ã«è©•ä¾¡ã—ã€ãã‚Œã‚’æ”¹å–„ã‚µã‚¤ã‚¯ãƒ«ã«çµ„ã¿è¾¼ã‚€ã“ã¨ã§ã€å‰è¿°ã—ãŸã‚ˆã†ãªLLMã‚’ç”¨ã„ãŸãƒ—ãƒãƒ€ã‚¯ãƒˆé–‹ç™ºç‰¹æœ‰ã®èª²é¡Œã‚’è§£æ±ºã™ã‚‹ãŸã‚ã®ã‚¢ãƒ—ãƒãƒ¼ãƒã§ã™ã€‚

å…·ä½“çš„ã«ã¯ã€ã‚·ã‚¹ãƒ†ãƒ ã®ã‚¢ã‚¦ãƒˆã‚«ãƒ ã¨é€£å‹•ã™ã‚‹è©•ä¾¡æŒ‡æ¨™ï¼ˆå›žç”ã®æ£ç¢ºæ€§ã€è‡ªç„¶ã•ã€æ£è§£ãƒ‡ãƒ¼ã‚¿ã¨ã®å¿ å®Ÿæ€§ã€å¿œç”é€Ÿåº¦ã€å‡¦ç†ã‚³ã‚¹ãƒˆãªã©ã®ãƒ™ãƒ¼ã‚·ãƒƒã‚¯ãªã‚‚ã®ã‹ã‚‰ãƒ¦ãƒ¼ã‚¹ã‚±ãƒ¼ã‚¹ç‰¹åŒ–ã®ã‚«ã‚¹ã‚¿ãƒžã‚¤ã‚ºã•ã‚ŒãŸè©•ä¾¡è¦³ç‚¹ãªã©ï¼‰ã¨ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’å®šç¾©ã—ã€ã“ã‚Œã‚‰ã‚’åŸºã«ã‚·ã‚¹ãƒ†ãƒ ã®å€‹åˆ¥è¦ç´ ã¨å…¨ä½“ãã‚Œãžã‚Œã®å‡ºåŠ›å“è³ªã‚’è©•ä¾¡ã™ã‚‹ä»•çµ„ã¿ã‚’æ§‹ç¯‰ã—ã¾ã™ã€‚å®Ÿéš›ã®é–‹ç™ºãƒ—ãƒã‚»ã‚¹ã§ã¯ã•ã¾ã–ã¾ãªå®Ÿè£…ã€æ”¹å–„æ–½ç–ã«å¯¾ã—ã¦è©•ä¾¡ã‚’å®Ÿæ–½ã—ã€æœŸå¾…ã•ã‚Œã‚‹è©•ä¾¡çµæžœãŒå¾—ã‚‰ã‚Œã‚‹ã¾ã§æ”¹å–„ã‚µã‚¤ã‚¯ãƒ«ã‚’å›žã—ã¦ã„ãã¾ã™ã€‚

ã“ã‚Œã«ã‚ˆã‚Šå„æ–½ç–ãŒç‹™ã£ãŸèª²é¡Œè§£æ±ºã«ã¤ãªãŒã£ã¦ã„ã‚‹ã®ã‹ã€ã“ã‚Œã¾ã§ã§ãã¦ã„ãŸã“ã¨ãŒã§ããªããªã£ã¦ã„ãªã„ã‹ã€ã‚³ã‚¹ãƒˆã‚„å‡¦ç†æ™‚é–“ã«è¨±å®¹ã§ããªã„å½±éŸ¿ã‚’åŠã¼ã—ã¦ã„ãªã„ã‹ã€ãªã©ã‚’ç¶²ç¾…çš„ã€åŠ¹çŽ‡çš„ã«æŠŠæ¡ã§ãã‚‹ã‚ˆã†ã«ãªã‚‹ãŸã‚ã€åœ°ã«è¶³ã®ã¤ã„ãŸæ”¹å–„ãƒ—ãƒã‚»ã‚¹ã‚’å›žã™ã“ã¨ãŒå¯èƒ½ã«ãªã‚Šã¾ã™ã€‚

OpenAI DevDayã§ã‚‚LLMã®ã‚ˆã†ã«éžæ±ºå®šè«–çš„ãªæŠ€è¡“ã‚’å‚™ãˆãŸã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³ã‚’ãƒ—ãƒãƒˆã‚¿ã‚¤ãƒ—ã‹ã‚‰æœ¬ç•ªç’°å¢ƒã¸ç§»è¡Œã™ã‚‹éš›ã®é‡è¦ãªãƒ•ãƒ¬ãƒ¼ãƒ ãƒ¯ãƒ¼ã‚¯ã¨ã—ã¦è©•ä¾¡é§†å‹•é–‹ç™ºãŒç´¹ä»‹ã•ã‚Œã¦ã„ã¾ã™ã€‚

The key here is to adopt evaluation-driven development. Good evaluations are the ones which are well correlated to the outcomes that you're trying to derive or the user metrics that you care about. They have really high end-to-end coverage in the case of RAG and they're scalable to compute. This is ...

youtu.be

è©•ä¾¡é§†å‹•é–‹ç™ºã«ãŠã‘ã‚‹è©•ä¾¡æ–¹æ³•ã¨ãƒ—ãƒã‚»ã‚¹

è©•ä¾¡é§†å‹•é–‹ç™ºã«ãŠã‘ã‚‹è©•ä¾¡ã¯ä¸€èˆ¬çš„ã«ä»¥ä¸‹ã®3ã¤ã®æ–¹æ³•ã®çµ„ã¿åˆã‚ã›ã§å®Ÿæ–½ã•ã‚Œã¾ã™ã€‚

äººé–“ã«ã‚ˆã‚‹è©•ä¾¡ï¼š
- è¤‡æ•°ã®ã‚¿ã‚¹ã‚¯ã‚’æ¨ªæ–ã—ãŸæœ€çµ‚ã‚¢ã‚¦ãƒˆãƒ—ãƒƒãƒˆã®è©•ä¾¡ã‚„ãƒ‹ãƒ¥ã‚¢ãƒ³ã‚¹ã‚’å«ã‚ãŸè©•ä¾¡ãªã©ã€è‡ªå‹•åŒ–ã—ã«ãã„ç®‡æ‰€ã®è©•ä¾¡ã§æ´»ç”¨ã§ãã‚‹ä¸€æ–¹ã€ã‚¹ã‚±ãƒ¼ãƒ«æ€§ãŒä½Žã„ã“ã¨ãŒèª²é¡Œã¨ãªã‚Šã¾ã™ã€‚
AIã«ã‚ˆã‚‹è©•ä¾¡ï¼š
- ã„ã‚ã‚†ã‚‹LLM as a judgeã¨å‘¼ã°ã‚Œã‚‹ã€ç”Ÿæˆã•ã‚ŒãŸå‡ºåŠ›ã‚’LLMè‡ªä½“ã«è©•ä¾¡ã•ã›ã‚‹æ‰‹æ³•ã§ã™ã€‚ã“ã®æ–¹æ³•ã¯ã‚¹ã‚±ãƒ¼ãƒ«æ€§ãŒé«˜ã„ã®ãŒç‰¹å¾´ã§ã™ãŒã€LLMã«ã‚ˆã‚‹è‡ªå‹•è©•ä¾¡è‡ªä½“ã®è©•ä¾¡ã‚„ãƒãƒ¥ãƒ¼ãƒ‹ãƒ³ã‚°ãŒå¿…è¦ã«ãªã‚Šã€è©•ä¾¡ç²¾åº¦ã®æ‹…ä¿ãŒé‡è¦ã«ãªã‚Šã¾ã™ã€‚
ã‚³ãƒ¼ãƒ‰ãƒ™ãƒ¼ã‚¹ã®è©•ä¾¡ï¼š
- å…·ä½“çš„ãªãƒ«ãƒ¼ãƒ«ã‚„åŸºæº–ã«åŸºã¥ã„ã¦AIã®å‡ºåŠ›ã‚’è©•ä¾¡ã™ã‚‹ã‚¢ãƒ—ãƒãƒ¼ãƒã§ã™ã€‚ã‚ã‚‹ç¨‹åº¦ãƒ«ãƒ¼ãƒ«ãƒ™ãƒ¼ã‚¹ã«å“è³ªã‚’è©•ä¾¡ã§ãã‚‹ã‚±ãƒ¼ã‚¹ã§ã¯æ´»ç”¨ã§ãã¾ã™ãŒã€ãã‚Œä»¥å¤–ã®ã‚±ãƒ¼ã‚¹ï¼ˆã»ã¨ã‚“ã©ã®ã‚±ãƒ¼ã‚¹ï¼‰ã§ã¯æ´»ç”¨ã§ããªã„ç‚¹ãŒãƒ‡ãƒ¡ãƒªãƒƒãƒˆã§ã™ã€‚

å½“ç¤¾ã§ã‚‚åˆæœŸã¯å°‘æ•°ã®è©•ä¾¡ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’æ§‹ç¯‰ã—ã€äººæ‰‹ã«ã‚ˆã‚‹è©•ä¾¡ã‚’è¡Œã£ã¦ã„ã¾ã—ãŸãŒã€ã‚¢ãƒ¼ã‚ãƒ†ã‚¯ãƒãƒ£ã®è¤‡é›‘æ€§ã‚„è©•ä¾¡ãƒ‡ãƒ¼ã‚¿æ•°ã®å¢—åŠ ã«ä¼´ã„ã€æ¯”è¼ƒçš„ã™ãã«äººåŠ›ã®è©•ä¾¡ãŒé›£ã—ããªã£ãŸãŸã‚ã€RAGASã‚„Langfuseã‚’å°Žå…¥ã—ã¦AIã«ã‚ˆã‚‹è©•ä¾¡ã®è‡ªå‹•åŒ–ã€ãƒ¢ãƒ‹ã‚¿ãƒªãƒ³ã‚°ã«å–ã‚Šçµ„ã‚“ã§ã„ã¾ã™ã€‚

è©•ä¾¡ãƒ—ãƒã‚»ã‚¹ã«ã¤ã„ã¦ã¯ã€ä»¥ä¸‹ã®ã‚ˆã†ãªé€²ã‚æ–¹ã‚’ã—ã¦ã„ã¾ã™ã€‚

è©•ä¾¡ã®ä»•çµ„ã¿ã®é–‹ç™º
1. ãƒ¦ãƒ¼ã‚¹ã‚±ãƒ¼ã‚¹ã”ã¨ã«ä»£è¡¨çš„ãªå°‘æ•°ï¼ˆåæ•°å€‹ç¨‹åº¦ï¼‰ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’ä½œæˆã™ã‚‹
2. RAGASãªã©ã‚’æ´»ç”¨ã—ã€ä»£è¡¨çš„ãªè©•ä¾¡æŒ‡æ¨™ã‚’å°Žå…¥
ãƒªãƒªãƒ¼ã‚¹æ™‚
1. å°Žå…¥ã™ã¹ãã‹æ‚©ã‚“ã§ã„ã‚‹æ–°ãŸãªå¤‰æ›´ã‚„æ”¹å–„ã‚’å®Ÿéš›ã«è©•ä¾¡ã—ã¦ã¿ã‚‹
2. è©•ä¾¡çµæžœã‚’è¦‹ã¤ã¤ã€æ©Ÿèƒ½ã®å®Ÿè£…åˆ¤æ–ã¨è©•ä¾¡è‡ªä½“ã®æ”¹å–„ã‚’è¡Œã†
ãƒªãƒªãƒ¼ã‚¹ã•ã‚ŒãŸå¾Œ
1. ãƒ¦ãƒ¼ã‚¶ãƒ¼ã®ãƒ•ã‚£ãƒ¼ãƒ‰ãƒãƒƒã‚¯ã‚„åˆ©ç”¨ãƒã‚°ãƒ‡ãƒ¼ã‚¿ã‚’é›†ã‚ã¤ã¤ã€ãƒªãƒªãƒ¼ã‚¹ã—ãŸæ©Ÿèƒ½è‡ªä½“ã‚’è©•ä¾¡
2. è©•ä¾¡åŸºç›¤è‡ªä½“ã‚’è‚²ã¦ã‚‹ãŸã‚ã«ã€åˆ©ç”¨ãƒ‡ãƒ¼ã‚¿ã‹ã‚‰è©•ä¾¡ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®æ‹¡å……ã‚„è©•ä¾¡åŸºæº–ã‚’æ”¹å–„

ç‰¹ã«åˆæœŸã¯ãƒ†ã‚¹ãƒˆã‚±ãƒ¼ã‚¹ã®ç¶²ç¾…æ€§ãŒã»ã¨ã‚“ã©ãªã„ã¨æ„Ÿã˜ã‚‰ã‚ŒãŸã‚Šã€å¾Œè¿°ã™ã‚‹ã‚ˆã†ãªæ£è§£ãƒ‡ãƒ¼ã‚¿ä½œæˆã®é›£ã—ã•ã«ã‚ˆã£ã¦ä¸€ã¤ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’å®šç¾©ã™ã‚‹ã®ã«æ•°æ™‚é–“ç¨‹åº¦ã‹ã‹ã‚‹ã“ã¨ã‚‚ã–ã‚‰ã«ã‚ã£ãŸãŸã‚ã€ã“ã®å–ã‚Šçµ„ã¿è‡ªä½“ã«æ„å‘³ãŒã‚ã‚‹ã®ã ã‚ã†ã‹ã¨ä¸å®‰ã«ãªã‚Šã¾ã—ãŸã€‚ ã—ã‹ã—ç¾å®Ÿçš„ã«æœ€åˆã‹ã‚‰å¤§é‡ã®ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’æº–å‚™ã™ã‚‹ã®ã¯é›£ã—ã„ã§ã™ã—ã€æ£ç¢ºãªè©•ä¾¡ã‚ˆã‚Šã‚‚ã€ã¾ãšè©•ä¾¡ãƒ—ãƒã‚»ã‚¹è‡ªä½“ã‚’å›žã—å§‹ã‚ã‚‹ã“ã¨è‡ªä½“ãŒé‡è¦ã§ã‚‚ã‚ã‚Šã€åŸºæœ¬çš„ã«ã¯å°‘æ•°ã§ã‚‚è‰¯ã„ã®ã§åˆã‚ã¦ã¿ã‚‹ã“ã¨ãŒå¤§äº‹ãªã®ã ã¨æ€ã„ã¾ã™ã€‚

è©•ä¾¡é§†å‹•é–‹ç™ºï¼ˆEval-driven development ï¼‰ã®é©ç”¨äº‹ä¾‹

å½“ç¤¾ã§ã¯ã¾ã å–ã‚Šçµ„ã¿åˆæœŸã®æ®µéšŽã§ã”ç´¹ä»‹ã§ãã‚‹äº‹ä¾‹ãŒå°‘ãªã„ãŸã‚ã€ã„ãã¤ã‹å…¬é–‹ã•ã‚Œã¦ã„ã‚‹äº‹ä¾‹ã‚’ä¸å¿ƒã«ã”ç´¹ä»‹ã—ã¾ã™ã€‚

Vercel v0

vercel.com

è‡ªç„¶è¨€èªžã‹ã‚‰UIãƒ‡ã‚¶ã‚¤ãƒ³ï¼ˆã‚³ãƒ¼ãƒ‰ï¼‰ã®è‡ªå‹•ç”ŸæˆãŒå¯èƒ½ãªv0ã‚’é–‹ç™ºã—ã¦ã„ã‚‹ãƒãƒ¼ãƒ ã®ç™ºè¡¨ã—ãŸãƒ–ãƒã‚°ã§ã¯ã€VercelãŒå–ã‚Šçµ„ã‚“ã§ã„ã‚‹è©•ä¾¡é§†å‹•é–‹ç™ºï¼ˆEval-driven development ï¼‰ã«ã¤ã„ã¦èª¬æ˜Žã•ã‚Œã¦ã„ã¾ã™ã€‚è‡ªå‹•ã‚¹ã‚¯ãƒªãƒ—ãƒˆã«ã‚ˆã‚‹è©•ä¾¡ãƒ†ã‚¹ãƒˆã®å®Ÿè¡Œã¨GitHubãƒ—ãƒ«ãƒªã‚¯ã‚¨ã‚¹ãƒˆã¨ã®é€£æºã‚’è¡Œã„ã€å‡ºåŠ›ã«å½±éŸ¿ã‚’åŠã¼ã™ã™ã¹ã¦ã®ãƒ—ãƒ«ãƒªã‚¯ã‚¨ã‚¹ãƒˆã«ã¤ã„ã¦è©•ä¾¡ãŒãƒˆãƒªã‚¬ãƒ¼ã•ã‚Œã€çµæžœãŒé–‹ç™ºè€…ã«ãƒ•ã‚£ãƒ¼ãƒ‰ãƒãƒƒã‚¯ã•ã‚Œã¦ã„ã‚‹ãã†ã§ã™ã€‚è©•ä¾¡ãŒé–‹ç™ºãƒ—ãƒã‚»ã‚¹ã«çœŸã«çµ„ã¿è¾¼ã¾ã‚Œã¦ã„ã‚‹é¢ç™½ã„äº‹ä¾‹ã ã¨æ€ã„ã¾ã™ã€‚

Anaconda Assistant

www.anaconda.com

Anacondaç¤¾ã¯Anaconda Assistantï¼ˆãƒ‡ãƒ¼ã‚¿ã‚µã‚¤ã‚¨ãƒ³ã‚¹ã‚„AIãƒ—ãƒã‚¸ã‚§ã‚¯ãƒˆã«ãŠã‘ã‚‹ã‚³ãƒ¼ãƒ‰ã®ä½œæˆã€åˆ†æžã€ãƒ‡ãƒãƒƒã‚°ã‚’æ”¯æ´ã™ã‚‹ãƒ„ãƒ¼ãƒ«ï¼‰ã®é–‹ç™ºã«ãŠã„ã¦ã€è©•ä¾¡é§†å‹•é–‹ç™ºã‚’æŽ¡ç”¨ã—ãŸé–‹ç™ºãƒ—ãƒã‚»ã‚¹ã«ã¤ã„ã¦ã®ãƒ–ãƒã‚°ã‚’å…¬è¡¨ã—ã¦ã„ã¾ã™ã€‚ãƒ¦ãƒ¼ã‚¶ãƒ¼ã«ã¨ã£ã¦ã®ã‚¯ãƒªãƒ†ã‚£ã‚«ãƒ«ãªæ€§èƒ½ã«ãƒ•ã‚©ãƒ¼ã‚«ã‚¹ã—ãŸè©•ä¾¡åŸºæº–ã®è¨å®šã‚„ã€è©•ä¾¡ã®å…ˆã®è‡ªå‹•ãƒãƒ¥ãƒ¼ãƒ‹ãƒ³ã‚°ï¼ˆAgentic Feedback Iterationï¼‰ã®å–ã‚Šçµ„ã¿ãªã©ã‚‚ç´¹ä»‹ã•ã‚Œã¦ãŠã‚Šã€å‚è€ƒã«ãªã‚‹éƒ¨åˆ†ãŒå¤šã„ã§ã™ã€‚

Dosu

blog.dosu.dev

Dosuã¯GitHubãƒªãƒã‚¸ãƒˆãƒªä¸Šã§ã‚½ãƒ•ãƒˆã‚¦ã‚§ã‚¢é–‹ç™ºè€…ã‚’æ”¯æ´ã™ã‚‹AIãƒ„ãƒ¼ãƒ«ã§ã€ç‰¹ã«éžã‚³ãƒ¼ãƒ‡ã‚£ãƒ³ã‚°ã‚¿ã‚¹ã‚¯ï¼ˆè³ªå•å¯¾å¿œã‚„èª²é¡Œã®åˆ†é¡žãªã©ï¼‰ã‚’è»½æ¸›ã™ã‚‹ã“ã¨ã§ã€é–‹ç™ºè€…ãŒæœ¬æ¥ã®ä½œæ¥ã«é›†ä¸ã§ãã‚‹ç’°å¢ƒã‚’æä¾›ã—ã¦ã„ã¾ã™ã€‚Dosuã®é–‹ç™ºãƒãƒ¼ãƒ ã‚‚å½“åˆã¯ãƒã‚°ã‚’æ‰‹å‹•ã§åˆ†æžã—ã¦èª²é¡Œã®ç‰¹å®šã‚„æ”¹å–„ã‚’è¡Œã£ã¦ã„ãŸã‚‚ã®ã®ã€ã‚³ãƒ¼ãƒ‰ã®æ›´æ–°ã¨ç•°ãªã‚ŠLLMã®ãƒ—ãƒãƒ³ãƒ—ãƒˆã‚„å‡¦ç†ãƒ—ãƒã‚»ã‚¹ã®èª¿æ•´ãŒåŠã¼ã™ä¸ç¢ºå®šãªå½±éŸ¿ã‚’æŠŠæ¡ã—åˆ‡ã‚‹ã“ã¨ãŒé›£ã—ããªã‚Šã€è©•ä¾¡é§†å‹•é–‹ç™ºã‚’æŽ¡ç”¨ã—ã¦ã„ã¾ã™ã€‚

è©•ä¾¡é§†å‹•é–‹ç™ºã«å–ã‚Šçµ„ã‚€ä¸Šã§ç‰¹ã«é›£æ˜“åº¦ãŒé«˜ã„ã¨æ„Ÿã˜ã‚‹ã®ã¯æ£è§£ãƒ‡ãƒ¼ã‚¿ã®ä½œæˆã§ã™ã€‚ LLMã‚·ã‚¹ãƒ†ãƒ ã§ã¯å¾€ã€…ã«ã—ã¦æ£è§£è‡ªä½“ã‚’å®šç¾©ã™ã‚‹ã“ã¨ãŒé›£ã—ã„ã‚±ãƒ¼ã‚¹ãŒå¤šã„ã¨æ€ã„ã¾ã™ã€‚ ã„ãã¤ã‹ç†ç”±ã¯ã‚ã‚‹ã¨ãŠã‚‚ã„ã¾ã™ãŒã€ç‰¹ã«è‡ªåˆ†ãŒæ„Ÿã˜ã‚‹ç†ç”±ã‚’æŒ™ã’ã¦ã¿ã¾ã™ã€‚

LLMã«ä»»ã›ã‚‹ã‚¿ã‚¹ã‚¯ã®ç‰¹æ€§ã«ã‚ˆã‚‹ã‚‚ã®
- å®Ÿæ¥å‹™ã«LLMã‚’é©ç”¨ã™ã‚‹å ´åˆã€ã„ããªã‚Šå®Ÿç”¨åŒ–ãƒ¬ãƒ™ãƒ«ã®æœ€çµ‚ã‚¢ã‚¦ãƒˆãƒ—ãƒƒãƒˆã‚’ä½œã‚‹ã“ã¨ã¯é›£ã—ã„ãŸã‚ã€ä¸é–“ç”Ÿæˆç‰©ã‚’LLMã«ä½œã‚‰ã›ã‚‹ã“ã¨ã§å…¨ä½“ã®åŠ¹çŽ‡åŒ–ã‚’ç›®æŒ‡ã™ã‚±ãƒ¼ã‚¹ãŒå¤šã„ã§ã™ã€‚
- ã“ã®ã‚±ãƒ¼ã‚¹ã§ã¯äººã«ã‚ˆã£ã¦ä½œæ¥ãƒ—ãƒã‚»ã‚¹è‡ªä½“ãŒé•ã†ã“ã¨ã‚‚ã‚ã£ãŸã‚Šã€ã“ã‚Œã¾ã§ã®æ¥å‹™ã§ä¸é–“ç”Ÿæˆç‰©ãŒæ˜Žç¢ºã«ã‚¢ã‚¦ãƒˆãƒ—ãƒƒãƒˆã¨ã—ã¦èªè˜ã•ã‚Œã¦ã„ãªã„ã‚±ãƒ¼ã‚¹ãŒå¤šãã€æ£è§£ã®å®šç¾©è‡ªä½“ã‹ã‚‰å§‹ã‚ã‚‹å¿…è¦ãŒã‚ã‚Šã€é›£ã—ã•ã®è¦å› ã«ãªã£ã¦ã„ã¾ã™ã€‚
ãƒ¦ãƒ¼ã‚¶ãƒ¼å´ã®ã‚³ãƒ³ãƒ†ã‚ã‚¹ãƒˆã®é•ã„ã«ã‚ˆã‚‹ã‚‚ã®
- ä»®ã«åˆ¥ã®ãƒ¦ãƒ¼ã‚¶ãƒ¼ã‹ã‚‰åŒã˜æ–‡é¢ã§è³ªå•ã‚„æŒ‡ç¤ºãŒæŠ•ã’ã‚‰ã‚ŒãŸå ´åˆã§ã‚‚ã€ãã‚Œãžã‚Œã®ãƒ¦ãƒ¼ã‚¶ãƒ¼ã®æ—¢çŸ¥ã®æƒ…å ±ã‚„ã€ãƒ¦ãƒ¼ã‚¶ãƒ¼ã”ã¨ã«ç½®ã‹ã‚ŒãŸã‚³ãƒ³ãƒ†ã‚ã‚¹ãƒˆãŒé•ã†å ´åˆã¯ã€åŒã˜ã‚¢ã‚¦ãƒˆãƒ—ãƒƒãƒˆã§ã‚‚ç•°ãªã‚‹è©•ä¾¡ã«ãªã‚‹ã“ã¨ãŒã‚ã‚Šå¾—ã¾ã™ã€‚
- æ£ç¢ºã«è©•ä¾¡ã™ã‚‹ã®ã§ã‚ã‚Œã°ã‚¯ã‚¨ãƒªã¨æ£è§£ãƒ‡ãƒ¼ã‚¿ã®ã‚»ãƒƒãƒˆã ã‘ã§ã¯ãªãã€ãƒ¦ãƒ¼ã‚¶ãƒ¼ã®ç½®ã‹ã‚ŒãŸã‚³ãƒ³ãƒ†ã‚ã‚¹ãƒˆã‚„æ—¢çŸ¥ã®æƒ…å ±ãªã©ã”ã¨ã«ã€æ£è§£ã‚’åˆ†ã‘ã¦ä½œã‚‹å¿…è¦ãŒå‡ºã¦ãã¾ã™ãŒã€ã“ã®ãƒ¬ãƒ™ãƒ«ã®ç´°ã‹ã„è©•ä¾¡ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’ç¶²ç¾…çš„ã«ä½œã£ã¦ã„ãã®ã¯ç¾å®Ÿçš„ã§ã¯ã‚ã‚Šã¾ã›ã‚“ã€‚
ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ãƒ†ã‚£ãƒ–ãªä½“é¨“è¨è¨ˆã«ã‚ˆã‚‹ã‚‚ã®
- ç‰¹ã«AIã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã‚„ãƒãƒ£ãƒƒãƒˆåž‹ã®RAGã‚·ã‚¹ãƒ†ãƒ ãªã©ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ãƒ†ã‚£ãƒ–æ€§ã‚’æŒãŸã›ã‚‹ã‚±ãƒ¼ã‚¹ã«ãŠã„ã¦ã¯ã€ä¸€å›žä¸€å›žã®ã‚„ã‚Šå–ã‚Šè‡ªä½“ã‚ˆã‚Šã‚‚ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ã‚·ãƒ§ãƒ³å…¨ä½“ã‚’é€šã˜ã¦ãƒ¦ãƒ¼ã‚¶ãƒ¼ã®èª²é¡ŒãŒè§£æ±ºã•ã‚ŒãŸã‹ã©ã†ã‹ãŒé‡è¦ã¨ãªã‚Šã¾ã™ã€‚
- ã‚¤ãƒ³ã‚¿ãƒ©ã‚¯ãƒ†ã‚£ãƒ–ãªã‚„ã‚Šå–ã‚Šã¾ã§å«ã‚ã¦æ§˜ã€…ãªãƒ‘ã‚¿ãƒ¼ãƒ³ã®è©•ä¾¡ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã‚’ä½œæˆã™ã‚‹ã®ã¯éžç¾å®Ÿçš„ã§ã™ãŒã€ãƒ¦ãƒ¼ã‚¶ãƒ¼ç›®ç·šã§ã¯å€‹åˆ¥ã®å‡ºåŠ›ã¨ã„ã†ã‚ˆã‚Šã¯å…¨ä½“ã®ä½“é¨“ã¨ã—ã¦ã®ã‚¢ã‚¦ãƒˆã‚«ãƒ ã®è©•ä¾¡ã«ãªã‚‹ãŸã‚ã€ã“ã®ã‚®ãƒ£ãƒƒãƒ—ã‚’ã©ã®ã‚ˆã†ã«åŸ‹ã‚ã‚‹ã‹ãŒéžå¸¸ã«é›£ã—ã„ã¨æ„Ÿã˜ã¦ã„ã¾ã™ã€‚

ã“ã®ã‚ˆã†ãªé›£ã—ã•ã‚’ã©ã†ä¹—ã‚Šè¶Šãˆã¦ã„ãã®ã‹ã¯ã¾ã è¦‹ãˆã¦ã„ã¾ã›ã‚“ãŒã€ä¾‹ãˆã°å¾Œã‚ã®äºŒç‚¹ã«ã¤ã„ã¦ã¯è©•ä¾¡ç”¨ã®AIã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã‚’æ§‹ç¯‰ã—ã€ãƒ¦ãƒ¼ã‚¶ãƒ¼ãŒé”æˆã—ãŸã„ä»®æƒ³çš„ãªã‚´ãƒ¼ãƒ«è¨å®šã¨ã‚³ãƒ³ãƒ†ã‚ã‚¹ãƒˆã‚’ä¸Žãˆã¦ã€æ§˜ã€…ãªã‚·ãƒŠãƒªã‚ªã‚’è‡ªå‹•è©•ä¾¡ã™ã‚‹ã¨ã‹ã§ãã‚‹ã¨å¤¢ãŒåºƒãŒã‚‹ãªãƒ¼ã¨æ€ã£ã¦ã„ã¾ã™ã€‚

æœ€å¾Œã«ï¼š

ä»Šå›žã”ç´¹ä»‹ã—ãŸè©•ä¾¡é§†å‹•é–‹ç™ºï¼ˆEval-driven developmentï¼‰ã®å®Ÿè·µã«ãŠã„ã¦ã¯ã€è©•ä¾¡å˜ä½ã®æœ€é©åŒ–ã€è©•ä¾¡æ‰‹æ³•ã®ã‚¹ã‚±ãƒ¼ãƒ«æ€§ã€ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã®æ§‹ç¯‰æ–¹æ³•ãªã©ã€è¶…ãˆã‚‹ã¹ãå•é¡Œã¯ãŸãã•ã‚“ã‚ã‚Šã¾ã™ã€‚è©•ä¾¡åŸºç›¤ã‚’æ—©æœŸã«æ§‹ç¯‰ã—ã€é©åˆ‡ãªè©•ä¾¡ã‚’ä¸å¿ƒã¨ã—ãŸé–‹ç™ºãƒ—ãƒã‚»ã‚¹ã‚’å›žã›ã‚‹ã‹ã©ã†ã‹ã¯ã€LLMã‚¢ãƒ—ãƒªã‚±ãƒ¼ã‚·ãƒ§ãƒ³é–‹ç™ºã«ãŠã„ã¦é•·æœŸçš„ã«ã¿ã¦éžå¸¸ã«ãƒ¬ãƒãƒ¬ãƒƒã‚¸ã®åŠ¹ãéƒ¨åˆ†ã ã¨æ€ã£ã¦ãŠã‚Šã€ä»Šå¾Œã®AIãƒ—ãƒãƒ€ã‚¯ãƒˆé–‹ç™ºã«ãŠã‘ã‚‹ã‚¹ã‚¿ãƒ³ãƒ€ãƒ¼ãƒ‰ã«ãªã£ã¦ã„ãã®ã§ã¯ã¨è€ƒãˆã¦ã„ã¾ã™ã€‚

å½“ç¤¾ã§ã‚‚æ—¥ã€…æ¨¡ç´¢ã—ãªãŒã‚‰é€²ã‚ã¦ã„ã‚‹ãŸã‚ã€AIæ™‚ä»£ã®ãƒ—ãƒãƒ€ã‚¯ãƒˆé–‹ç™ºã«èˆˆå‘³ã®ã‚ã‚‹æ–¹ã€ã™ã§ã«å–ã‚Šçµ„ã¾ã‚Œã¦ã„ã‚‹æ–¹ã€æ˜¯éžä»¥ä¸‹ã®ãƒªãƒ³ã‚¯ã‹ã‚‰ãŠè©±ã—ã§ãã‚‹ã¨å¬‰ã—ã„ã§ã™ï¼

jobs.layerx.co.jp

ã¾ãŸã€LayerXã§ã¯ã€AIãƒ—ãƒãƒ€ã‚¯ãƒˆé–‹ç™ºã«èˆˆå‘³ã®ã‚ã‚‹ãƒ‡ã‚¶ã‚¤ãƒŠãƒ¼ã€ã‚¨ãƒ³ã‚¸ãƒ‹ã‚¢ã€PdMã‚’å‹Ÿé›†ã—ã¦ã„ã¾ã™ã€‚ ã”èˆˆå‘³ã®ã‚ã‚‹æ–¹ã¯ã€ãœã²ãƒã‚§ãƒƒã‚¯ã—ã¦ãã ã•ã„ï¼

open.talentio.com