すごく久々に。前回の内容、覚えてるかなw 前回まではTD学習について説明していて、最後に○×ゲームに対してQ学習を使ったAIを実装した。今日からはTD()について説明していく。動的計画法、モンテカルロ法、TD学習のおさらいまずは、これまでのおさらいから。動的計画法、モンテカルロ法、TD学習（Sarsa、Q学習）とや…

いものやま。

強化学習について学んでみた。（その23）