強化学習について学んでみた。(その21)

昨日は○×ゲームをプレイできるようにするところまで実装した。 今日はSarsa法を使ったAIを実装していく。 Valueクラス まずは行動価値を表すValueクラスから。 #==================== # value.rb #==================== require './state' module TicTacToe class Value @@step_size = 0.1 def initialize @value = Hash.n…