強化学習について学んでみた。(その31)

昨日は、関数近似を組合せる方法が、従来のテーブル型の拡張になっていることを確認した。 今日は、関数近似の1つである、線形手法について説明する。 線形手法 線形手法では、線形関数を使って、価値ベクトルを近似する。 といっても、状態や状態行動対はの空間に存在していないので、まずはこれらをの空間へ写像してやる…