DeepLearningによる将棋の学習11~6ブロック化と対局結果~

前回は現状で最も良いと考えられるモデルで学習させてみました。 今回はResidualBlockを一つ増やして6個として実験してみました。 Epoch Total Loss Policy Loss Value Loss Policy Accuracy Value Accuracy 1 3.1680 3.0230 0.5797 0.3130 0.6512 2 2.7987 2.6588 0.5595 0.3539 0.6681 3 2.6395 2.5019 0.5506 0.3677 0.…