見習いデータサイエンティストの隠れ家
id:dskomei
PyTorchを使って連続値制御の深層強化学習を構築 〜Actor Critic〜
人間と同じように考える機械を作るのは、人間の大きな夢であり、それができるかもしれないと言われているのが強化学習の枠組みです。強化学習は、ディープラーニングを取り入れることでめざましく進化してきました。今回は、そのディープラーニングを使って行う強化学習である深層強化学習を実践していきます。前回は、方…