Unityで遊ぼう [機械学習編] その6 (機械学習の成果)

coublood.hatenablog.com ここからはひたすら学習結果の確認とフィードバック。 実際は報酬の与え方や割合が悪いと、学習が進みませんが、今回はうまくいきました。 最初はなかなか平均点が上がっていきませんし、上がったり下がったりの繰り返し。 Mean Rewardが「獲得報酬の平均」。 この頃は、まだゴールにたどり着くま…