#1では連載の経緯とDQNの理解にあたって簡単な全体像について言及し、#2ではマルコフ決定過程、#3では価値関数とベルマン方程式、#4ではQ-Networkについてまとめました。 https://lib-arts.hatenablog.com/entry/followup_reinforce4#4までで基本的な仕組みについてはまとめられたので、#5ではDeep Q-Networkにおける工夫…

Liberal Art’s diary

Deep Q-Network⑤における工夫｜強化学習フォローアップシリーズ #5