[B! google][dqn][Google] beth321ã®ãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯

beth321 id:beth321

googleã¨dqnã¨Googleã«é–¢ã™ã‚‹beth321ã®ãƒ–ãƒƒã‚¯ãƒžãƒ¼ã‚¯ (4)

${{author_name}}$

{{{comment_expanded}}}

{{label}}

{{#is_bookmark}}ãƒªã‚¹ãƒˆ{{/is_bookmark}}{{^is_bookmark}}ãƒªãƒ³ã‚¯{{/is_bookmark}}

${{author_name}}$
{{author_name}}{{created}}
{{ #comment }}{{ comment }}{{ /comment }}
- {{ label }}

${{author_name}}$

{{{comment_expanded}}}

{{label}}

{{#is_bookmark}}ãƒªã‚¹ãƒˆ{{/is_bookmark}}{{^is_bookmark}}ãƒªãƒ³ã‚¯{{/is_bookmark}}

Googleã®äººå·¥çŸ¥èƒ½ã€ŒDQNã€ã€ã‚¢ã‚¿ãƒªã‚²ãƒ¼ãƒ ã§äººé–“ã‚ˆã‚Šãƒã‚¤ã‚¹ã‚³ã‚¢å©ãå‡ºã™
ç±³Googleã®DeepMindãƒãƒ¼ãƒ ã¯2æœˆ25æ—¥ï¼ˆç¾åœ°æ™‚é–“ï¼‰ã€äººå·¥çŸ¥èƒ½ï¼ˆAIï¼‰ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ ã€Œdeep Q-networkï¼ˆDQNï¼‰ã€ã«ã¤ã„ã¦ã®è«–æ–‡ã‚’ç™ºè¡¨ã—ãŸã€‚DQNã¯ã‚¼ãƒã‹ã‚‰ã‚²ãƒ¼ãƒ ã®ãƒ«ãƒ¼ãƒ«ã‚’å¦ç¿’ã—ã€ã€ŒBreakoutã€ã‚„ã€ŒPongã€ï¼ˆãƒ–ãƒãƒƒã‚¯å´©ã—ï¼‰ãªã©ã®ã€ŒAtari 2600ã€ã®2æ¬¡å…ƒãƒ“ãƒ‡ã‚ªã‚²ãƒ¼ãƒ ã§æœ€çµ‚çš„ã«ã¯äººé–“ã‚ˆã‚Šãƒã‚¤ã‚¹ã‚³ã‚¢ã‚’ç²å¾—ã™ã‚‹ã¾ã§ã«æˆé•·ã—ãŸã€‚ DQNã«ã¤ã„ã¦ã®ã€ŒHuman-level control through deep reinforcement learningï¼ˆæ·±å±¤å¼·åŒ–å¦ç¿’ã«ã‚ˆã‚‹äººé–“ãƒ¬ãƒ™ãƒ«ã®åˆ¶å¾¡ï¼‰ã€ã¨é¡Œã™ã‚‹è«–æ–‡ãŒç§‘å¦é›‘èªŒNatureã®ã‚µã‚¤ãƒˆã«æŽ²è¼‰ã•ã‚ŒãŸã€‚ DQNã¯ã€ç±³IBMã®Watsonã®ã‚ˆã†ã«ãƒ“ãƒƒã‚°ãƒ‡ãƒ¼ã‚¿ã‚’è§£æžã—ãŸçµæžœã‚’æç¤ºã™ã‚‹ã®ã§ã¯ãªãã€ã‚¼ãƒã‹ã‚‰å¦ç¿’ã—ã¦é€²åŒ–ã—ã¦ã„ãäººå·¥ã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆã€‚â€œãƒ”ã‚¯ã‚»ãƒ«ã¨ã‚²ãƒ¼ãƒ ã‚¹ã‚³ã‚¢ã‚’å…¥åŠ›ã™ã‚‹ã ã‘ã§â€ã‚²ãƒ¼ãƒ ã«ç¹°ã‚Šè¿”ã—ãƒˆãƒ©ã‚¤ã—ã¦ãƒžã‚¹ã‚¿ãƒ¼ã—ã¦ã„
beth321 2015/02/27
science

Google

ITmedia ãƒ‹ãƒ¥ãƒ¼ã‚¹

ã‚¢ãƒ«ã‚´ãƒªã‚ºãƒ

äººå·¥çŸ¥èƒ½

ãƒ‹ãƒ¥ãƒ¼ã‚¹

google

ã‚ã¨ã§èªã‚€

DQN

ç§‘å¦
ãƒªãƒ³ã‚¯
GoogleãŒäººå·¥çŸ¥èƒ½ã€ŒDQNã€ã‚’é–‹ç™ºã€€è‡ªã‚‰å¦ã³äººé–“ã‚’ä¸Šå›žã‚‹èƒ½åŠ›ã®ç²å¾—ã‚‚ : ç—›ã„ãƒ‹ãƒ¥ãƒ¼ã‚¹(ï¾‰âˆ€`)
GoogleãŒäººå·¥çŸ¥èƒ½ã€ŒDQNã€ã‚’é–‹ç™ºã€€è‡ªã‚‰å¦ã³äººé–“ã‚’ä¸Šå›žã‚‹èƒ½åŠ›ã®ç²å¾—ã‚‚ 1 åå‰ï¼šæ—¥æœ¬èŒ¶ â˜…ï¼š2015/02/26(æœ¨) 13:53:07.15 ID:???*.net ã€ãƒ¯ã‚·ãƒ³ãƒˆãƒ³ï¼å·åˆæ™ºä¹‹ã€‘ç±³ã‚°ãƒ¼ã‚°ãƒ«ã¯ã€Œãƒ–ãƒãƒƒã‚¯å´©ã—ã€ãªã©ã®é›»åã‚²ãƒ¼ãƒ ã®æ”»ç•¥æ³•ã‚’éŠã³ãªãŒã‚‰è‡ªã‚‰ç·¨ã¿å‡ºã—ã€äººé–“ä»¥ä¸Šã®é«˜å¾—ç‚¹ã‚’å‡ºã›ã‚‹äººå·¥çŸ¥èƒ½ï¼ˆï¼¡ï¼©ï¼‰ã‚’é–‹ç™ºã—ãŸã€‚ã‚„ã‚Šæ–¹ã‚’æ•™ã‚ã‚‰ãªãã¦ã‚‚è‡ªåˆ†ã§å¦ç¿’ã™ã‚‹ï¼¡ï¼©ã«é“ã‚’é–‹ãç ”ç©¶æˆæžœã§ã€å°†æ¥ã¯äººé–“ã«ã—ã‹ã§ããªã„ã¨æ€ã‚ã‚Œã¦ã„ãŸè¤‡é›‘ãªä»•äº‹ã‚’ã“ãªã›ã‚‹ã‚ˆã†ã«ãªã‚‹å¯èƒ½æ€§ã‚‚ã‚ã‚‹ã€‚26æ—¥ä»˜ã®è‹±ç§‘å¦èªŒãƒã‚¤ãƒãƒ£ãƒ¼ï¼ˆé›»åç‰ˆï¼‰ã§ç™ºè¡¨ã™ã‚‹ã€‚ é–‹ç™ºã—ãŸã®ã¯ã€äººé–“ã®è„³ã®ç¥žçµŒå›žè·¯ã‚’ã¾ããŸå¦ç¿’æ©Ÿèƒ½ã‚’æŒã¤ï¼¡ï¼©ã€Œï¼¤ï¼±ï¼®ã€ã€‚ã‚¹ãƒšãƒ¼ã‚¹ã‚¤ãƒ³ãƒ™ãƒ¼ãƒ€ãƒ¼ã‚„ãƒ–ãƒãƒƒã‚¯å´©ã—ãªã©æ‡ã‹ã—ã®ã‚²ãƒ¼ãƒ 49ç¨®é¡žã‚’ï¼¡ï¼©ã«ä¸ŽãˆãŸã€‚ã‚²ãƒ¼ãƒ ã®äº‹å‰çŸ¥è˜ã‚’æ•™ãˆãªãã¦ã‚‚ã€äººé–“ã®ã‚ˆã†ã«ç¹°ã‚Šè¿”ã—éŠã¶ã“ã¨ã§ã‚„ã‚Šæ–¹ã‚’å¦ã³ã€é«˜å¾—ç‚¹ã‚’å–ã‚‹ç§˜è¨£ã‚’ç·¨ã¿å‡ºã™ã€‚ ãƒ–ãƒãƒƒã‚¯å´©ã—ã‚’ç´„100å›žéŠ
beth321 2015/02/27
Google

(ï¾‰âˆ€`)

åå‰

ãƒã‚¿

Google

æŠ€è¡“

ã‚²ãƒ¼ãƒ

ãƒ‹ãƒ¥ãƒ¼ã‚¹

å¦ã³

DQN
ãƒªãƒ³ã‚¯
ã‚²ãƒ¼ãƒ ã‚’è‡ªã‚‰å¦ã‚“ã§äººé–“ä»¥ä¸Šã«ä¸Šé”ã§ãã‚‹äººå·¥çŸ¥èƒ½ã€ŒDQNã€ãŒäººé–“ã‚’è„…ã‹ã™æ—¥ã¯ã„ã¤ãã‚‹ã®ã‹ï¼Ÿ
By PhOtOnQuAnTiQuE äººé–“ã®è„³ãŒå¦ç¿’ã™ã‚‹ä»•çµ„ã¿ã‚’å†ç¾ã™ã‚‹ãƒ‡ã‚£ãƒ¼ãƒ—ãƒ©ãƒ¼ãƒ‹ãƒ³ã‚°ã®ç ”ç©¶ãŒé€²ã‚“ã ã“ã¨ã§ã€ã‚³ãƒ³ãƒ”ãƒ¥ãƒ¼ã‚¿ãƒ¼ã«ã‚ˆã‚‹äººå·¥çŸ¥èƒ½(AI)ã®æŠ€è¡“ãŒé£›èºçš„ãªé€²åŒ–ã‚’é‚ã’ã¦ã„ã¾ã™ã€‚GoogleãŒ500å„„å††ã§è²·åŽã—ãŸã¨ã„ã‚ã‚Œã¦ã„ã‚‹ã‚¤ã‚®ãƒªã‚¹ã®ãƒ™ãƒ³ãƒãƒ£ãƒ¼ä¼æ¥ã€ŒDeepMindã€ãŒé–‹ç™ºã—ãŸã‚¨ãƒ¼ã‚¸ã‚§ãƒ³ãƒˆãƒ—ãƒã‚°ãƒ©ãƒ ã€ŒDQN(Deep Q-Network)ã€ã¯ä¸€åº¦ãƒ—ãƒã‚°ãƒ©ãƒ ã‚’èµ·å‹•ã•ã›ã‚‹ã¨ã‚ã¨ã¯äººé–“ãŒæ‰‹ã‚’åŠ ãˆãªãã¦ã‚‚ã€Œã‚¹ãƒšãƒ¼ã‚¹ã‚¤ãƒ³ãƒ™ãƒ¼ãƒ€ãƒ¼ã€ã‚„ã€Œãƒ–ãƒãƒƒã‚¯å´©ã—ã€ã¨ã„ã£ãŸã‚²ãƒ¼ãƒ ã‚’ä¸€äººã§å‹æ‰‹ã«ç·´ç¿’ã—ã€ãƒã‚¤ã‚¹ã‚³ã‚¢ã‚’ãŸãŸãå‡ºã™æ–¹æ³•ã‚’å¦ç¿’ã§ãã‚‹ãƒ¬ãƒ™ãƒ«ã«é”ã—ã¦ãŠã‚Šã€ä»Šå¾Œã®AIé–‹ç™ºã‚’ã•ã‚‰ã«åŠ é€Ÿã•ã›ã‚‹ãƒ–ãƒ¬ãƒ¼ã‚¯ã‚¹ãƒ«ãƒ¼ã«ãªã‚‹ã¨è€ƒãˆã‚‰ã‚Œã¦ã„ã¾ã™ã€‚ Google DeepMind http://deepmind.com/ Human-level control through deep reinforcement learnin
beth321 2015/02/26
youtube

dqn

Google

é–‹ç™º

AI

ã‚ã¨ã§èªã‚€

æ©Ÿæ¢°å¦ç¿’
ãƒªãƒ³ã‚¯
ã‚°ãƒ¼ã‚°ãƒ«ã€è‡ªã‚‰å¦ã¶äººå·¥çŸ¥èƒ½é–‹ç™ºã€€ã‚²ãƒ¼ãƒ ç¹°ã‚Šè¿”ã—éŠã‚“ã§æ”»ç•¥ - æ—¥æœ¬çµŒæ¸ˆæ–°èž
ã€ãƒ¯ã‚·ãƒ³ãƒˆãƒ³=å·åˆæ™ºä¹‹ã€‘ç±³ã‚°ãƒ¼ã‚°ãƒ«ã¯ã€Œãƒ–ãƒãƒƒã‚¯å´©ã—ã€ãªã©ã®é›»åã‚²ãƒ¼ãƒ ã®æ”»ç•¥æ³•ã‚’éŠã³ãªãŒã‚‰è‡ªã‚‰ç·¨ã¿å‡ºã—ã€äººé–“ä»¥ä¸Šã®é«˜å¾—ç‚¹ã‚’å‡ºã›ã‚‹äººå·¥çŸ¥èƒ½ï¼ˆAIï¼‰ã‚’é–‹ç™ºã—ãŸã€‚ã‚„ã‚Šæ–¹ã‚’æ•™ã‚ã‚‰ãªãã¦ã‚‚è‡ªåˆ†ã§å¦ç¿’ã™ã‚‹AIã«é“ã‚’é–‹ãç ”ç©¶æˆæžœã§ã€å°†æ¥ã¯äººé–“ã«ã—ã‹ã§ããªã„ã¨æ€ã‚ã‚Œã¦ã„ãŸè¤‡é›‘ãªä»•äº‹ã‚’ã“ãªã›ã‚‹ã‚ˆã†ã«ãªã‚‹å¯èƒ½æ€§ã‚‚ã‚ã‚‹ã€‚26æ—¥ä»˜ã®è‹±ç§‘å¦èªŒãƒã‚¤ãƒãƒ£ãƒ¼ï¼ˆé›»åç‰ˆï¼‰ã§ç™ºè¡¨ã™ã‚‹ã€‚é–‹ç™ºã—ãŸã®ã¯ã€äººé–“ã®è„³ã®ç¥žçµŒå›žè·¯ã‚’ã¾ããŸå¦ç¿’æ©Ÿèƒ½
beth321 2015/02/26
ãƒã‚¿

google

AI

ãƒãƒƒãƒˆ

dqn

game

ãƒ‹ãƒ¥ãƒ¼ã‚¹

äººå·¥çŸ¥èƒ½

åå‰

deep learning
ãƒªãƒ³ã‚¯
1