昨日はグリーディAIを実装した。今日からは強化学習を使ってAIを作っていく。方針まず、方針について。強化学習にはいくつかのアルゴリズムがあるけれど、今回はSarsa()法を使う。これは強化学習について学んでみた。（その19） - いものやま。で説明したSarsa法を拡張したもので、価値の差分に対する学習を直前の状…

いものやま。

「BirdHead」の思考ルーチンを作ってみた。（その3）