注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
はじめに 本書の概要 本の対象者 必要な前提知識 おすすめできない人 おすすめの人 はじめに 今回は2017... はじめに 本書の概要 本の対象者 必要な前提知識 おすすめできない人 おすすめの人 はじめに 今回は2017/9/21に出版された「速習 強化学習-基礎理論とアルゴリズム」についてザッと読んだ感想などを述べていきます。 速習 強化学習 ―基礎理論とアルゴリズム― 作者: Csaba Szepesvari,小山田創哲,前田新一,小山雅典,池田春之介,大渡勝己,芝慎太朗,関根嵩之,高山晃一,田中一樹,西村直樹,藤田康博,望月駿一 出版社/メーカー: 共立出版 発売日: 2017/09/21 メディア: 単行本 この商品を含むブログを見る 本書の概要 マルコフ決定過程 価値推定問題 制御 さらなる勉強のために 割引マルコフ決定過程の理論 TD法の前方観測的な見方と後方観測的な見方について 深層強化学習を含む最近の発展 となっています。 特筆すべきなのは、問題を数式で定式化してから解説するというこ
2017/10/31 リンク