ぱたへね
id:natsutan
強化学習(第2版)とCourseraの強化学習コースをやった
強化学習がよく分からないので、根性入れてCourseraで勉強してみました。 一応、最後までいけたのまとめました。 coursera.org 動機 仕事でロボットをやっていてRT-1が気になってました。RT-1を少し調べてみたら、Vanilla BCと言うのが出てきて、どうもこれが強化学習/模倣学習のベースラインっぽい。BCがBehavioral Cloni…