ChainerでやってみるActor-Critic(Deep DPG) - ドラフト編 - Qiita
強化学習といえばDeep Q learningみたいなのりで、DQNがもてはやされていますが、AlphaGoとかロボットの機械学習では数年前くらいからActor-Criticに移行してきているように…