ç±³Appleã®AIç ”ç©¶è€…ã‚‰ã¯10月7日(ç¾åœ°æ™‚間)ã€ã€ŒGSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Modelsã€ï¼ˆLLMã«ãŠã‘ã‚‹æ•°å¦çš„推論ã®é™ç•Œã‚’ç†è§£ã™ã‚‹ï¼‰ã¨ã„ã†è«–文を発表ã—ãŸã€‚ ã“ã®è«–æ–‡ã¯ã€LLM(大è¦æ¨¡è¨€èªžãƒ¢ãƒ‡ãƒ«ï¼‰ãŒã€æœ¬å½“ã«äººé–“ã®ã‚ˆã†ã«è«–ç†çš„ã«è€ƒãˆã¦å•é¡Œã‚’解ã‘ã‚‹ã®ã‹ã€ã¨ã„ã†ç–‘å•ã‚’検証ã—ã¦ã„る。çµè«–ã¨ã—ã¦ã¯ã€LLMã¯ä»Šã®ã¨ã“ã‚ã€è¡¨é¢çš„ãªãƒ‘ターンを真似ã¦ç”ãˆã‚’出ã—ã¦ã„ã‚‹ã ã‘ã§ã€çœŸã®æŽ¨è«–能力ã¯æŒã£ã¦ã„ãªã„ã¨ä¸»å¼µã—ã¦ã„る。 ç ”ç©¶è€…ã‚‰ã¯ã€ã“れらã®å•é¡Œç‚¹ã‚’検証ã™ã‚‹ãŸã‚ã«ã€ã€ŒGSM-Symbolicã€ã¨ã„ã†æ–°ã—ã„テスト方法を開発ã—ãŸã€‚ã“ã‚Œã¯ã€LLMã®æ•°å¦çš„推論能力を評価ã™ã‚‹ãŸã‚ã®ãƒ™ãƒ³ãƒãƒžãƒ¼ã‚¯ãƒ‡ãƒ¼ã‚¿ã‚»ãƒƒãƒˆã€ŒGSM8Kã€ã‚’改良ã—ã€å•é¡Œã®è¡¨ç¾ã‚„æ•°å—を柔軟ã«å¤‰ãˆã‚‰ã‚Œã‚‹ã‚ˆã†ã«ã—ãŸ

{{#tags}}- {{label}}
{{/tags}}