共有
  • 記事へのコメント10

    • 注目コメント
    • 新着コメント
    その他
    isrc
    isrc 全体像/方策関数/価値関数/価値ベース/方策ベース/モデルベース/方策オン/オフ/価値ベースのアルゴリズム/方策ベースのアルゴリズム

    2019/10/30 リンク

    その他
    fubar_foo
    fubar_foo actor criticは方策勾配やら価値関数推定やらから派生してるから、そこの繋がりも入れた方が良いと思う。

    2018/11/06 リンク

    その他
    yoiIT
    yoiIT “価値関数をディープにしたものがDQN”

    2018/11/06 リンク

    その他
    salamander_jp
    salamander_jp "We were supposed to make AI do all the work and we play games but we do all the work and the AI is playing games!"

    2018/11/06 リンク

    その他
    Taniken
    Taniken “はじめに 深層強化学習の分野では日進月歩で新たなアルゴリズムが提案されています. それらを学ぶ上で基礎となるアルゴリズム(というより概念に近い?)はQ学習, SARSA, 方策勾配法, Actor-Criticの4つだと思われるので, これ

    2018/11/06 リンク

    その他
    yaruo5222
    yaruo5222 DQNは知ってるよ!!!

    2018/11/06 リンク

    その他
    MacRocco
    MacRocco あばばばばばばばばばばばばばば

    2018/11/06 リンク

    その他
    stealthinu
    stealthinu 強化学習アルゴリズムの種類についてまとめられてる。Actor-Critic系ってのがあるのか。知らんかった。

    2018/11/06 リンク

    その他
    tiamointer
    tiamointer “書いているうちに規模がどんどん大きくなってしまったので, どこかに必ず間違いや不足があります. 「この式がおかしい!」「このアルゴリズムも追加するべき!」などコメントがあればぜひお願いします”

    2018/11/06 リンク

    その他
    peroon
    peroon 無言ブクマの数wこれもう英語学習と同じだな

    2018/11/06 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    深層強化学習アルゴリズムまとめ

    はじめに 深層強化学習の分野では日進月歩で新たなアルゴリズムが提案されています. それらを学ぶ上で基...

    ブックマークしたユーザー

    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事