注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
強化学習で人に二足歩行を覚えさせました。「proximal policy optimization (PPO)」というアルゴリズム... 強化学習で人に二足歩行を覚えさせました。「proximal policy optimization (PPO)」というアルゴリズムを使っています。youtube:https://www.youtube.com/channel/UCI2-ki0BQzmQ_tE4mxG8rXQ/videosTwitter:https://twitter.com/physics_engine0BGM:「Trick or treat」written by GT-K「Halloween Monsters」written by ISAo.
2017/11/16 リンク