å æ¥ããµã¨ãããã£ããã§ãã¾ãã¾å ç*1ããã¡ãã®è«æã«ã¤ãã¦è§¦ãããã¦ããã®ãè¦ãããã®ã§ããã
ããã¯æ¨è¦ã·ã¹ãã åéã«ãããNNç 究ã®åç¾æ§ã«ã¤ãã¦æ¤è¨¼ãã2019å¹´ã®è«æã§ãè¿å¹´ã®ãããä¼è°*2ã«æ¡æãããNNææ³18åã«å¯¾ãã¦åç¾ã試ã¿ãã¨ããããreasonableãªãåªåã§åç¾ã§ããã®ã¯ãããã«7åã«éããããã®ä¸ã§ã1åã¯è«æä¸ã§ä¸»å¼µããããã¼ã¹ã©ã¤ã³ãè¶ ãããã¨ã¯åºæ¥ãªãã£ãã¨å ±åãã¦ãã¾ãã
ãã ããã®å ±åã¯NNç 究ã«ãããåç¾æ§ã«é¢ããè°è«ã®ããã¾ã§ãä¸ä¾ã§ãããå®éã³ããç¦ä»¥åãããè«æä¸ã§ã¯SOTAãéæã¨æ¸ãã¦ããã®ã«åãå®è£ ãã©ãçµãã§ãSOTAã«éããªããã¿ãããªæ¥çå話ã¯ãããããã§è³ã«ãããã®ã§ãããããããªãããå®éã®ã½ããã¦ã§ã¢ãã¢ããªã±ã¼ã·ã§ã³ã¨ãã¦ãããã®NNææ³ãç¨ãããã¦ãå°ä¸ã¤ãã®çµæã¨ãã¦ä½ãããã®ä¸å ·åã§ãèµ·ããªãéãã¯ãæ©æ¢°å¦ç¿æ¥çã®å¤å´*3ã«ç¥ããããã¨ããã¾ããªãã£ãã®ãäºå®ã ã¨æããã¾ãã
æ¨ä»ã®ç©ºåã®LLMãã¼ã ã§ãããããã«ããé©ãå±ãããé©ãçéãè·æããããã«ãªããå°æ´ã¦ã¼ã¶ã¼å´ã§ã¯ãã®è¾ºã®è©±é¡ã¯ãã£ããå¿ãå»ãããæãããã¾ãããChatGPTã®ç»å ´ã§ãã£ã¼ãã¼ç¶æ
ã ã£ãLLMçéãï¼ä¾ãã°å¾ç¶ã®ãã¼ã«ã©ã¤ã¼ã¼ã·ã§ã³ãéè¦ãã軽éLLMã®ç»å ´ããããã«ãªã£ããã¨ã§ï¼è½ã¡çãã¦ãããã¨ããããæ¹ãã¦NNç 究ã®åç¾æ§åé¡ã«ã¹ãããã©ã¤ããå½ã¦ã¦ãè¯ãã®ããªã¨å人çã«æã£ãã®ã§ãããã¨ãããã¨ã§ãå人çãªåå¿é²ãå
¼ãã¦ãã£ããã¾ã¨ãã¦ã¿ããã¨æãã¾ãã
- ç 究æ¥çã«ãããNNç 究ã®åç¾æ§åé¡ã®æãããæ¹
- ããã¾ã§ãå人çãªææ³
- ä½è«
ç 究æ¥çã«ãããNNç 究ã®åç¾æ§åé¡ã®æãããæ¹
æå¤ã¨NNç 究ã®åç¾æ§ãæ¸å¿µãã声ã¨ããã®ã¯ããªãåããæãã£ã¦ãã¦ãããããåé ã«æããè«æãã³ããç¦åã®2019å¹´ã«åºã¦ãããã¨ãèããã°ãä»ãã4å¹´ãåã«ã¯æ¢ã«è«æã¨ãã¦ã¾ã¨ãããã¦ãããç¨åº¦ã«ã¯æ¥çå ã§ã¯åºãç¥ãããäºæ ã§ãã£ãã¨è¨ããã®ã§ã¯ãªãã§ãããããã¾ããæ©æ¢°å¦ç¿åéã®ãããå½éä¼è°ã§ããNeurIPSã2019年大ä¼ã®éã«åç¾æ§åé¡ã«é¢ãã調æ»ãè¡ã£ã¦ããï¼ä¸è¨ãªã³ã¯ï¼ãå°ãªãã¨ãç 究è ã®éã§ã¯èª²é¡æèãå ±æããã¦ããããã«è¦ãã¾ãã
ãã ããå®éã«ãNNç 究ã«åç¾æ§ã®ä½ããã®ãå¤ããã¨ãã話é¡ãå ¬ã®å ´ã§çãã«è¨ãããããã«ãªã£ãã®ã¯ãã¯ãã³ããç¦ä»¥éãããã¨ããèªèããããä¾ãã°Natureãeditorialã§ææããã®ã¯2021å¹´ã®ãã¨ã ã£ãããã¾ãããã®editorialã®ä¸ã§ã¯å²ã¨åºæ±ã«æ¸¡ã£ã¦ãä½ãNNç 究ã®åç¾æ§ãæãªã£ã¦ããã®ãããè«ãããã¦ãããä¾ãã°
- ãã¼ã¿åéããã»ã¹ã®è©³ç´°ï¼ãã¤ã¢ã¹ãé¿ããããï¼
- ãã¼ã¿åå¦çã®è©³ç´°ï¼cherry-pickingãé¿ããããï¼
- Train / dev / testãã¼ã¿ã»ããã®é¸ã³æ¹ï¼åä¸ï¼
- Ablation study*4ã®å®æ½çµæï¼ææ¡é¨åã«å®éã«å¹æããã£ããã©ããã示ãããï¼
- å¦ç¿ã«ããã£ãæé
- å¦ç¿æã«ä½¿ç¨ããä¹±æ°ã·ã¼ã
- å¦ç¿ã ãã§ãªããã¼ã¿åéã»åå¦çã¾ã§å«ããå ¨ä½ã§ä½¿ç¨ããã³ã¼ã
- 使ç¨ããã½ããã¦ã§ã¢ã©ã¤ãã©ãªã»ãã¼ãã¦ã§ã¢ã®ãã¼ã¸ã§ã³ã¾ã§å«ããæ å ±
ãªã©ãªã©ãè«æä¸ã§å ±åãã¹ãã§ãããã¨æå±ãã¦ãã¾ããããã¯åè«ã§ãªããNNç 究ã«ããã¦ç¨ãããããå ¨ã¦ãããå ±åããã¨è¨ã£ã¦ããã«çãããç 究ããå´ããããã°å¤§å¤ãªè² è·ã«ãªã話ãªã®ã§ã¯ãªããã¨æããã¾ãããä¸æ¹ã§å®éã«ä¾ãã°ã使ç¨ããNNãã¬ã¼ã ã¯ã¼ã¯ã®ãã¼ã¸ã§ã³ã«ãã£ã¦ç²¾åº¦ãå¤ãããã¨ããè«æãåºã¦ããã¨ãããè¦ãã¨èª¬å¾åã®ãã話ã ã¨æãã¾ãã
ãã®è«æãããã§ãTensorFlowã¨PyTorchã®ããããã§å
¨ãåããã¼ã¿ã»ããã«å¯¾ãã¦å
¨ãåãNNãçµãã§ããã©ã¼ãã³ã¹ãæ¯è¼ããã¨ããããã¼ã¸ã§ã³ãå¤ããã¨ããã©ã¼ãã³ã¹ãï¼å ´åã«ãã£ã¦ã¯ç¡è¦ã§ããªãã»ã©ï¼å¤ããã¨ãããã¨ã示ãã¦ãã¾ãã
ããã¾ã§ãå人çãªææ³
åã¯NNã©ãããæ©æ¢°å¦ç¿åéå
¨ä½ã§è¦ã¦ãã¢ã«ãããã¯ãªç 究è
ã§ã¯ãªããããã¾ã§ããããã®ç§å¦æè¡ã®ãã¦ã¼ã¶ã¼ãã«éãã¾ããã®ã§ãå®éã«NNç 究ãè¡ã£ã¦ãã人ãã¡ã®è¦ç¹ããã©ãè¦ãã¦ãããã«ã¤ãã¦ã¯ããããæ¥çå
ã§é£ã³äº¤ãå話ãéæã®é¡ãè¦ãªãããæ¨ãéããããªãç¶æ³ã§ãã
ããã§ãå人çãªææ³ãæ¸ãã¦ãã¾ãã¨ãçµå±ã®ã¨ããNNã«é¢ãã¦ããç¨åº¦æ±ç¨æ§ã®é«ãçè«è§£æãé²ãã§ããããã®ç¹æ§ãç解ãããã¦ããªããã¨ãããæããNNï¼ã¨ãããDeep Learningï¼ç 究åæã®é ã¯ãããã©ã¼ãã³ã¹ã«åç¾æ§ããªãæ°ããããã©ãã¾ããããªãã®ããã§æµããã¦ãããã®ããã©ãã©ãã¢ãã«ã¨ã·ã¹ãã ã¢ã¼ããã¯ãã£ã巨大åãã¦ãã®åç¾æ§ã®ä½ããæ·±å»ãªåé¡ãå¼ãèµ·ããããã«ãªã£ã¦ããããè¦ãªãã£ããµããããã¦ããã¨ãããã¨ãªã®ããªã¨æãã¦ãã¾ãã
ãã£ã¨ããçè«çãªå´é¢ããã®å¯¾çãä½ãåºã¦ããªããã¨ããã¨ãããªãã¨ã¯ãªãã¦ãä¾ãã°æ¨è¦ã·ã¹ãã åãNNç 究ã®åç¾æ§ã®ä½ããæ´»æ§åé¢æ°ï¼ç¹ã«ReLUï¼ã®æ§è³ªã«æ±ãããã¨ã§ããããæ¹è¯ãããã¨ã§åç¾æ§ãæ ä¿ãããã¨ããç 究ãåºã¦ããããã¾ãã
ããããå®éã«MLç 究çéããèããã¦ããã®ã¯ãããªã«ãè¡åã®è¯ã話ã°ããã§ã¯ãªãã¦ãé ·ãã¨ãdev / testãã¼ã¿ã»ããã®è¨å®ã®ã¨ããã§ã¤ã³ããããã£ã¦ãããã¿ãããªåããã£ãããã¯ãã¾ããä¸çªçµæã®è¯ãã£ãä¹±æ°ã·ã¼ãã®æã®çµæã ãå ±åãã¦ãã¦ä»ã¯ã話ã«ãªããªããã¿ãããªãã¨ã ã£ããããã¾ããã¤ã¾ããããã¯ä»¥åãã®ããã°ã§ãç®èã£ããããªã俺æ§ãèããæå¼·ã®ãããã¯ã¼ã¯é¸æ権ãç¶æ ãæªã ã«ç¶ãã¦ãã¦*5ãããããã®æ§æè¦ç´ ãããã«å¤å¤§ã«ãªã£ããã¨ã§ãã©ããå¼ã£ãçµæãæå¼·ãã«ãªã£ãããåããããã©ãã¾ã§æ®éæ§ã®ãã話ãªã®ããåãããªããã¨ãããã¨ã«ãªã£ã¦ããããã«ãè¦åãããã¾ãã
以ååç¾æ§åé¡ã®ç¶²ç¾ çãªã¬ãã¥ã¼ãæ¸ããè¨äºã§ãææããããã«ãããèªåã«ã¨ã£ã¦é½åã®è¯ãåæçµæã欲ãããã¨ãã人é¡æ®éã®æ¬²æ±ã¨ããã欲æãããåç¾æ§åé¡ã®æ大ã®è¦å ããªãã§ãããããã®ãé½åãããSOTAéæãã®ãããªæ°å¤ææ¨ã«ãªã£ã¦ããããããããããããã¯ãããã¨ãç®çã«ãªã£ã¦ãã¾ã£ã¦ããã¨ãããã¨ãªã®ã§ããããåã®éå»ã«æ¾è¨ãããéä¸åãã®ä¸ã§ããæ°å¤ææ¨ã¯å¿ ãããã¯ããããã¨å¯ãããã¨ãããã¾ãã*6ãã¾ãã«ãããå°ã§è¡ãææ§ã ã¨æãã¦ãã¾ãã
ãããèªä½ã¯ããæå³ãéå»ã«ãªãã£ããã®ãè¦åºãoréå»ã®æ§è½ãè¶ ããããã¨ãè³ä¸å½é¡ã®åºç¤ç 究ã®ä¸çã®å®¿å½ãªã®ã§ãæ¬æ¥ãªãä¸æä¸å¤ã«ã¯è§£æ±ºãé£ãé£é¡ã§ãããå°éãªåçºã¨ç¾å ´ã§ã®å®æ¦ã§å¾ã ã«æ¹åãå³ãã¹ããã¨ãªã®ã§ããããããããä»ç¾å¨ã«ããã¦ã¯NNãã¼ã¹ã®LLMãã¾ãã«ç ´å£çã¤ããã¼ã·ã§ã³ãå¼ãèµ·ããããã¦ããã空åã®LLMãã¼ã ã§ãããããã®ä¼æ¥ã»çµç¹ãã次ã ã¨æ°ããLLMã¨ãããæ´ç¨ãããããã¯ããä½ãåºããã¦ã¯ä¸ã«éãåºãããã¨ããç¶æ³ã«ãªã£ã¦ããããã§ãããããªNNãã¼ã¹ã®LLMã®ä¸ã«ãåç¾æ§ã®ä½ãããã©ã¼ãã³ã¹ããåºãå¾ãªãLLMãå¤æ°æ··ãããããªäºæ ã«ãªãã°ãããã»ã©é¢åãªãã¨ããªãã¨æããã¾ãã
ãã¤ã¦ã¯arXivã«è¼ã£ãåç¾æ§ã®ä½ãNNè«æã¯ãã èªãã§å²ã£ã¦ããã°è¯ãã£ãã®ããNNããã¦LLMãè·æããç¾ä»£ã«ããã¦ã¯ãããªãã¨ãè¨ã£ã¦ããããªããªã£ãããã§ãããããå®åãµã¤ãã§ãNNç 究ã®åç¾æ§åé¡ã«ã¯è¯ãæºåãã¦å¯¾å¿ããã¹ãææãæ¥ã¦ããã®ããªã¨èãã¦ããã¨ããã§ãã
ä½è«
ã¡ãªã¿ã«ããã®è¨äºãæ¸ããã¨æã£ããã£ããã¯ãã¡ãã®ãã¤ã¼ããè¦ããããã¨ã§ãããNNã§ã¯ãªãä¸ã«æ©æ¢°å¦ç¿åéã®è©±ã§ãããªãã£ãããã§ãããããã§ããææ¡ææ³ã§ãã以ä¸ã¯å¿ ãæ¢åææ³ãä¸åã£ã¦ããªããã°ãªããªããã¨ãããã¬ãã·ã£ã¼ã¨ãã¤ã¢ã¹ããè©ä¾¡ææ¨ã®ããã¯ï¼ã©ãããè¦ããã«ãã£ã¦ã¯æ¹ç«ãªããæé ï¼ã«èµ°ã£ã¦ãã¾ãã¨ããã®ã¯ãã¾ãã«å®¿ç¾ã ãªã¨æãã次第ã§ãã
*1:しましま (@shima__shima) / Twitter
*2:KDD, SIGIR, WWW, RecSysã®4ã¤
*3:ã¤ã¾ãã¦ã¼ã¶ã¼å´
*4:アブレーション(ablation) | CVMLエキスパートガイド 【深層学習】【機械学習】
*5:最先端と泥臭い実務の現場とのはざまで、生きる - 渋谷駅前で働くデータサイエンティストのブログ
*6:https://twitter.com/TJO_datasci/status/943163206016499712