この記事は、 sykwer.hatenablog.jp これ↑の続きにあたるものです. Deterministic policy gradient theoremの導出だけ知りたい! という人以外は、最初の記事から読むことをおすすめします. 2) DPGアルゴリズム 2.1) DPGアルゴリズムを使っていくモチベーション 2.2) DPG theoremの導出 2.3) DPGの直感的な理解 2.4) DPGに…

sykwer’s blog

深層強化学習アルゴリズムDDPGをしっかり理解する(2)