強化学習について学んでみた。(その23)

すごく久々に。 前回の内容、覚えてるかなw 前回まではTD学習について説明していて、最後に○×ゲームに対してQ学習を使ったAIを実装した。 今日からはTD()について説明していく。 動的計画法、モンテカルロ法、TD学習のおさらい まずは、これまでのおさらいから。 動的計画法、モンテカルロ法、TD学習(Sarsa、Q学習)とや…