ã“ã®è¨˜äº‹ã§ã¯LLMãŒãƒžãƒ«ãƒã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã‚·ã‚¹ãƒ†ãƒ ã§ã©ã®ã‚ˆã†ã«å¿œç”¨ã•ã‚Œã†ã‚‹ã‹ã‚’ææ¡ˆã—ãŸè«–æ–‡ã‚’ç´¹ä»‹ã—ã¾ã™ã€‚

å¿ƒã®ç†è«–ï¼ˆTheory of Mindsï¼‰

äººé–“ã¯ãƒãƒ¼ãƒ ãƒ¯ãƒ¼ã‚¯ã‚’ã™ã‚‹ã¨ãã€ãƒãƒ¼ãƒ ãƒ¡ãƒ¼ãƒˆãŒã©ã®ã‚ˆã†ãªçŠ¶æ³ã§ã©ã‚“ãªè¡Œå‹•ã‚’ã©ã®ã‚ˆã†ãªæ„å›³ã§è¡Œã†ã‹ã‚’æŽ¨æ¸¬ã—ã¾ã™ã€‚ä¾‹ãˆã°ã€ã‚µãƒƒã‚«ãƒ¼é¸æ‰‹ã¯è¦‹æ–¹ãŒã©ã®ã‚ˆã†ãªæ„å›³ã§èµ°ã£ãŸã‚Šã€ãƒ‰ãƒªãƒ–ãƒ«ã‚’ã—ã¦ã„ã‚‹ã‹ã‚’å¯ŸçŸ¥ã—ã¦ã„ã‚‹ã¯ãšã§ã™ã€‚å‘³æ–¹ã®æ„å›³ã«åˆã‚ã›ã¦è‡ªåˆ†ã®è¡Œå‹•ï¼ˆã‚¹ãƒšãƒ¼ã‚¹ã«èµ°ã£ãŸã‚Šã€ãƒœãƒ¼ãƒ«ã‚’è¦æ±‚ã—ãŸã‚Šï¼‰ã‚’æ±ºã‚ã¾ã™ã€‚é€†ã«ãƒ‘ã‚¹ãŒã¤ãªãŒã‚‰ãªã‹ã£ãŸã¨ãã¯äº’ã„ã®æ„å›³ã‚’æŽ¨æ¸¬ã™ã‚‹ã®ã«å¤±æ•—ã—ãŸã¨ã„ã†ã“ã¨ã§ã™ã€‚ã€Œä»–è€…ãŒä½•ã‚’è€ƒãˆã¦ã„ã‚‹ã‹ã€ã‚’ç ”ç©¶ã™ã‚‹ã®ã¯ç™ºé”å¿ƒç†å¦ãªã©ã§ã‚‚ç ”ç©¶ã•ã‚Œã¦ããŸã“ã¨ã§ã‚ã‚Šï¼ˆä¾‹ï¼šã€Œã‚µãƒªãƒ¼ã¨ã‚¢ãƒ³èª²é¡Œã€ï¼‰ã€AIã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã‚‚äººé–“ã®ã‚ˆã†ã«ä»–è€…ã®æ€è€ƒã‚’ã†ã¾ãæŽ¨æ¸¬ã§ãã‚‹ã‹ã¯éžå¸¸ã«é¢ç™½ã„ãƒˆãƒ”ãƒƒã‚¯ã§ã‚ã‚Šã€å¿œç”¨ã¯å¤šå²ã«ã‚ãŸã‚Šã¾ã™ã€‚
ä»Šå›žã¯ã€ä»–è€…ã®å¿ƒã®çŠ¶æ…‹ã€ç›®çš„ã€æ„å›³ã€çŸ¥è˜ã€ä¿¡å¿µã€å¿—å‘ã€ç–‘å¿µã€æŽ¨æ¸¬ãªã©ã‚’æŽ¨æ¸¬ã™ã‚‹ç›´è¦³ã«ã‚ˆã‚‹å¿ƒã®æ©Ÿèƒ½ã§ã‚ã‚‹ã€Œå¿ƒã®ç†è«–ã€ã‚’LLMã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆãŒç²å¾—ã§ãã‚‹ã‹ã«ã¤ã„ã¦ç ”ç©¶ã—ãŸä»¥ä¸‹ã®è«–æ–‡ã‚’ç´¹ä»‹ã—ã¾ã™ã€‚

aclanthology.org

ä¿¡å¿µçŠ¶æ…‹

å¿ƒã®ç†è«–ã§ã¯ã€ã‚ã‚‹ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆãŒè€ƒãˆã¦ã„ã‚‹ã“ã¨ã‚’ã€Œä¿¡å¿µçŠ¶æ…‹ã€ã¨ã„ã„ã¾ã™ã€‚ãŸã¨ãˆã°ã€ã‚µãƒƒã‚«ãƒ¼ã®ä¾‹ã ã¨ã€ã€Œã“ã®ã‚¹ãƒšãƒ¼ã‚¹ã«å‘ã‹ã£ã¦ãƒ‰ãƒªãƒ–ãƒ«ã™ã‚Œã°ãƒãƒ£ãƒ³ã‚¹ã«ãªã‚‹ã€ã¨ã‹ã€Œãƒãƒƒã‚¯ãƒ‘ã‚¹ã‚’ã—ãŸæ–¹ãŒç›¸æ‰‹ãŒå‰ãŒã‹ã‚Šã«ãªã£ã¦ã‚¹ãƒšãƒ¼ã‚¹ãŒã†ã¾ã‚Œã‚„ã™ã„ã€ãªã©ã§ã™ã€‚ã‚µãƒƒã‚«ãƒ¼ã«é™ã‚‰ãšäººé–“ã¯ä½•ã‚’ã‚„ã‚‹ã«ã—ã¦ã‚‚ä½•ã‹ã—ã‚‰ã®æ„å›³ã‚„äºˆæ¸¬ã‚’ã—ã¦è¡Œå‹•ã‚’æ±ºå®šã—ã¦ã„ã¾ã™*1ã€‚
è¨€ã†ã¾ã§ã‚‚ãªãã€ãƒãƒ¼ãƒ ãƒ¯ãƒ¼ã‚¯ã‚’ã™ã‚‹ã¨ãã¯ç›¸æ‰‹ã®ä¿¡å¿µçŠ¶æ…‹ã‚’ã†ã¾ãäºˆæ¸¬ã—ãªã‘ã‚Œã°ã„ã‘ã¾ã›ã‚“ã€‚ ã•ã¦ã€LLMã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã«ãƒãƒ¼ãƒ ãƒ¯ãƒ¼ã‚¯ã‚’ã•ã›ã‚‹ã«ã¯ã©ã†ã™ã‚Œã°ã‚ˆã„ã§ã—ã‚‡ã†ã‹ã€‚æœ¬è«–æ–‡ã§ã¯ä»¥ä¸‹ã®3ç‚¹ã«ç€ç›®ã—ã¦ã„ã¾ã™ã€‚

0æ¬¡ToM (Theory of Mind) æŽ¨è«–LLMã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆãŒè‡ªèº«ã®ä¿¡å¿µçŠ¶æ…‹ã‚’æ˜Žç¢ºã«è¡¨ç¾ã§ãã‚‹èƒ½åŠ›ãŒã‚ã‚‹ã‹
1æ¬¡ToM ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆãŒä»–è€…ã®ä¿¡å¿µçŠ¶æ…‹ã‚’æŽ¨å®šã§ãã‚‹ã‹ã©ã†ã‹
2æ¬¡ToM ä»–è€…ãŒè‡ªèº«ã®ä¿¡å¿µçŠ¶æ…‹ã«ã¤ã„ã¦ä½•ã‚’è€ƒãˆã¦ã„ã‚‹ã‹ã‚’æŽ¨è«–ã§ãã‚‹ã‹ã©ã†ã‹

å®Ÿé¨“è¨å®š

æœ¬è«–æ–‡ã§æ‰±ã£ã¦ã„ã‚‹å•é¡Œè¨å®šã‚’å°‘ã—èª¬æ˜Žã—ã¾ã™ã€‚èªã¿é£›ã°ã—ã¦å¤§ä¸ˆå¤«ã§ã™ã€‚é›°å›²æ°—ã¨ã—ã¦ã¯ã€ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆãŒ3äººã„ã¦ã€ãã‚Œã‚‰ãŒçˆ†å¼¾å‡¦ç†ã‚’ã—ã¾ã™ã€‚ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã©ã†ã—ã¯çˆ†å¼¾ãŒã‚ã¨ã©ã‚Œãã‚‰ã„ã§çˆ†ç™ºã—ãã†ã§ã‚ã‚‹ã‹ã‚„ã€ãã®çˆ†å¼¾ã®ãƒ¯ã‚¤ãƒ¤ãƒ¼ã‚’åˆ‡ã‚‹ã‹ãªã©ä½•ã‹ã—ã‚‰ã®è¡Œå‹•ã‚’ã—ã¾ã™ã€‚

ç´°ã‹ã„å•é¡Œè¨å®š

3äººã®ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆï¼ˆAlphaã€Bravoã€Charlieï¼‰ãŒæœªçŸ¥ã®ç’°å¢ƒã«åˆ†æ•£ã—ã¦ã„ã¾ã™ã€‚è‰²ã¤ãã®çˆ†å¼¾ã®ä½ç½®ã‚’ç‰¹å®šã—ã€å®‰å…¨ã«è§£é™¤ã™ã‚‹ã“ã¨ã‚’ç›®çš„ã¨ã—ãŸãƒãƒ¼ãƒ ã§ã™ã€‚å„çˆ†å¼¾ã¯3è‰²ã®ã„ãšã‚Œã‹ã§ã€ãã‚Œãžã‚Œã®è‰²ã¯çˆ†å¼¾ã®ãƒ•ã‚§ãƒ¼ã‚ºã‚’è¡¨ã—ã¾ã™ã€‚è§£é™¤ã«ã¯æ£ã—ã„é †åºã®ãƒ¯ã‚¤ãƒ¤ãƒ¼ã‚«ãƒƒã‚¿ãƒ¼ãŒå¿…è¦ã§ã™ã€‚ ãƒãƒ¼ãƒ ãƒ¡ãƒ³ãƒãƒ¼ã¯ãã‚Œãžã‚Œç•°ãªã‚‹è‰²ã®ã‚«ãƒƒã‚¿ãƒ¼ã‚’æŒã£ã¦ã‚²ãƒ¼ãƒ ã‚’å§‹ã‚ã¾ã™ã€‚ ç’°å¢ƒã¯é€£çµã‚°ãƒ©ãƒ•ã¨ã—ã¦æ¦‚å¿µåŒ–ã•ã‚Œã€5å€‹ã®ãƒŽãƒ¼ãƒ‰ã¯å»Šä¸‹ï¼ˆã‚¨ãƒƒã‚¸ï¼‰ã§ã¤ãªãŒã£ãŸ5å€‹ã®éƒ¨å±‹ã‚’è¡¨ã—ã¾ã™ã€‚å„ãƒ©ã‚¦ãƒ³ãƒ‰ã«ãŠã„ã¦ã€ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã¯ä»¥ä¸‹ã®3ã¤ã®è¡Œå‹•ã‹ã‚‰ä¸€å€‹é¸æŠžã—ã¾ã™ã€‚ - 5å€‹ã®éƒ¨å±‹ã®ã†ã¡ã®1ã¤ã«ç§»å‹•ã™ã‚‹ - ç¾åœ¨ã®éƒ¨å±‹ã«ã‚ã‚‹çˆ†å¼¾ã®ãƒ•ã‚§ãƒ¼ã‚ºã‚’æ¤œæŸ»ã™ã‚‹ - 3å€‹ã®ãƒ¯ã‚¤ãƒ¤ãƒ¼ã‚«ãƒƒã‚¿ãƒ¼ã®ã†ã¡ã®1ã¤ã‚’ä½¿ç”¨ã™ã‚‹

ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã®è¦³æ¸¬ã¯ã€ç¾åœ¨ã®éƒ¨å±‹ã®ä¸èº«ã¨ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã®ã‚¹ãƒ†ãƒ¼ã‚¿ã‚¹ã«é™å®šã•ã‚Œã¾ã™ã€‚ãƒãƒ¼ãƒ ã®ã‚¹ã‚³ã‚¢ã€ç¾åœ¨ã®éƒ¨å±‹ã®ä¸èº«ã€ãƒãƒ¼ãƒ ãƒ¡ã‚¤ãƒˆã®ä½ç½®ã€åˆ©ç”¨å¯èƒ½ãªãƒ„ãƒ¼ãƒ«ã«ã¤ã„ã¦ã¯ã€å®šæœŸçš„ã«æ›´æ–°ã•ã‚Œã¾ã™ã€‚ $x$ æ®µéšŽã®çˆ†å¼¾ãŒè§£é™¤ã•ã‚Œã‚‹ã¨ã€ãƒãƒ¼ãƒ ã«ã¯ $10 x$ ãƒã‚¤ãƒ³ãƒˆãŒä¸Žãˆã‚‰ã‚Œã¾ã™ã€‚

å•é¡Œè¨å®šã®æ¦‚è¦ï¼ˆè«–æ–‡ã®å›³ã‚’å¼•ç”¨ã—ã¦ã„ã¾ã™ã€‚ï¼‰

LLM ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆ

æœ¬è«–æ–‡ã§ã¯ã€ãƒãƒ¼ãƒ ãƒ¯ãƒ¼ã‚¯ã‚’è¡Œã†ã«ã‚ãŸã£ã¦ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆãŒä¿¡å¿µçŠ¶æ…‹ã‚’æ˜Žç¤ºçš„ã«ä¿æŒã™ã‚‹ã®ãŒæœ›ã¾ã—ã„ã¨ã„ã£ã¦ã„ã¾ã™ã€‚å›³ï¼‘ã®ä¾‹ã§ã¯ã€AlphaãŒCommunication Messageã¨ã—ã¦Bravoã‹ã‚‰å—ã‘å–ã£ãŸãƒ¡ãƒƒã‚»ãƒ¼ã‚¸ã‚’ã‚‚ã¨ã«è‡ªåˆ†ã®ä¿¡å¿µã‚’æ›´æ–°ã—ã¦ã„ã¾ã™ã€‚ã“ã“ã§ä¿¡å¿µã¨ã¯ç’°å¢ƒã«ã¤ã„ã¦ã®æƒ…å ±ã¨è¨€ã£ã¦ã„ã„ã‹ã‚‚ã—ã‚Œã¾ã›ã‚“ã€‚ ã‚²ãƒ¼ãƒ ã®å¾—ç‚¹ã¯LLMã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆãŒä¿¡å¿µï¼ˆBeliefï¼‰çŠ¶æ…‹ã‚’æ˜Žç¤ºçš„ã«ä¿æŒã—ã¦ã„ã‚‹å ´åˆã®æ–¹ãŒé«˜ã„ã§ã™ã€‚ ã¡ãªã¿ã«MAPPOã¯ãƒžãƒ«ãƒã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆæ·±å±¤å¼·åŒ–å¦ç¿’ã®æœ‰åãªæ‰‹æ³•ã§ã™ã€‚

å‰µç™ºç¾è±¡ãŠã‚ˆã³0, 1, 2æ¬¡ToM

ãƒãƒ¼ãƒ ãƒ¯ãƒ¼ã‚¯ãŒå¿…è¦ãªä»Šå›žã®çˆ†å¼¾å‡¦ç†ã‚¿ã‚¹ã‚¯ã§ã™ãŒã€å‰µç™ºç¾è±¡ã¨ã‚‚ã¨ã‚Œã‚‹ç¾è±¡ãŒç¢ºèªã•ã‚Œã¦ã„ã¾ã™ã€‚å…·ä½“çš„ã«ã¯ã€ã‚ã‚‹ä¸€äººã®ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆãŒãƒªãƒ¼ãƒ€ãƒ¼ã¨ãªã‚Šã€ä»–ã®äºŒäººã«æŒ‡ç¤ºã‚’é€ã‚Šã¾ã™ã€‚ä¸‹ã®å›³ä¸Šéƒ¨ã§ã¯ã€AlphaãŒBravoã¨Charlieã«æŒ‡ç¤ºã‚’é€ã‚Š, äºŒäººãŒæŒ‡ç¤ºé€šã‚Šã«è¡Œå‹•ã—ã¦ã„ã‚‹ã®ãŒåˆ†ã‹ã‚Šã¾ã™ã€‚ ã¾ãŸä¸‹ã®å›³ä¸‹éƒ¨ã‚’è¦‹ã‚‹ã¨ã€LLMã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆ(+ä¿¡å¿µçŠ¶æ…‹)ã¯0, 1, 2æ¬¡ToMã‚’ä¿æŒã—ã¦ã„ã‚‹ã¨ã„ãˆãã†ã§ã™ã€‚

æ¬¡å›žäºˆå‘Š

æ¬¡å›žã¯ã‚ªãƒ¼ãƒ—ãƒ³ã‚½ãƒ¼ã‚¹ã®Llama3.2 3B-Instractã‚’ç”¨ã„ã¦å”èª¿è¡Œå‹•ãŒã§ãã‚‹ã‹ã‚’æ¤œè¨¼ã—ã¦ã¿ã¾ã™ã€‚

ã“ã®ãƒ–ãƒã‚°ã¯æ ªå¼ä¼šç¤¾EfficiNet Xã®ãƒ†ãƒƒã‚¯ãƒ–ãƒã‚°ã§ã™ã€‚

efficinetx.co.jp

*1:éƒ¨åˆ†è¦³æ¸¬ãƒžãƒ«ã‚³ãƒ•æ±ºå®šéŽç¨‹ã§ã¯ã€ã€Œä¿¡å¿µçŠ¶æ…‹ã¯å®Ÿéš›ã®(çœŸã®)çŠ¶æ…‹ã«ä»Šã©ã®ãã‚‰ã„ã„ã‚‹ã‹ã‚’è¡¨ã™ç¢ºçŽ‡ã€ã®ã“ã¨ã§ã™ã€‚

EfficiNetXâ€™s Tech Blog

æ ªå¼ä¼šç¤¾EfficiNet Xã®ãƒ†ãƒƒã‚¯ãƒ–ãƒã‚°ã§ã™

ãƒžãƒ«ãƒã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆAIç‰¹é›†â‘¡ (1/N) Theory of Mind for Multi-Agent Collaboration via LLM

å¿ƒã®ç†è«–ï¼ˆTheory of Mindsï¼‰

ä¿¡å¿µçŠ¶æ…‹

å®Ÿé¨“è¨å®š

ç´°ã‹ã„å•é¡Œè¨å®š

LLM ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆ

å‰µç™ºç¾è±¡ãŠã‚ˆã³0, 1, 2æ¬¡ToM

æ¬¡å›žäºˆå‘Š

å¿ƒã®ç†è«–ï¼ˆTheory of Mindsï¼‰

ä¿¡å¿µçŠ¶æ…‹

å®Ÿé¨“è¨­å®š

ç´°ã‹ã„å•é¡Œè¨­å®š

LLM ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆ

å‰µç™ºç¾è±¡ãŠã‚ˆã³0, 1, 2æ¬¡ToM

æ¬¡å›žäºˆå‘Š

å¿ƒã®ç†è«–ï¼ˆTheory of Mindsï¼‰

å®Ÿé¨“è¨å®š

ç´°ã‹ã„å•é¡Œè¨å®š

å‰µç™ºç¾è±¡ãŠã‚ˆã³0, 1, 2æ¬¡ToM