Stable Baselines入門 / GAIL|npaka
1. GAIL 「GAIL」(Generative Adversarial Imitaiton Learning)は「模倣学習」のひとつで、人間のデモ(一連の観測と行動)を与えて、模倣できていたら報酬を与える学習法です。現在の実装では画像による学習がまだ対応していません。 今回は、「CartPole-v0」環境を「GAIL」で学習します。 2. OpenMPI OpenMPI並列計算…