GRI Blog
id:gri-blog
【5分講義・深層強化学習#4】A3Cの手法の中身と性能を理解
以前の記事ではA3Cアルゴリズムを紹介しました。エージェントの非同期な学習を特徴とし、学習の高速化と安定かの効果があります。 gri-blog.hatenablog.com 今回この記事では、A3Cの学習法をさらに詳しく解説し、他の深層強化学習の手法と比べた性能をお伝えします。イメージとしてはA3Cの仕組みの全体像を把握し、原論文…