いものやま。
id:yamaimo0625
強化学習について学んでみた。(その29)
昨日は関数近似の説明をするための準備を行った。 今日は関数近似を強化学習とどのように組合せていくのか説明する。 関数近似による価値ベクトルの表現 強化学習に関数近似を組合せる場合、状態価値ベクトルや行動価値ベクトルを、パラメータをもった関数で近似的に表現する。 すなわち、状態価値ベクトルなら、パラメー…