AlphaZero 深層学習・強化学習・探索 人工知能プログラミング実践入門

先日読了。 AlphaZero 深層学習・強化学習・探索 人工知能プログラミング実践入門 作者:布留川 英一 ボーンデジタル Amazon 良書。AlphaZeroのしくみをゴールに強化学習をひととおり学べる。 多層バンディット問題、探索と利用のバランスを取る。 方策勾配法、エピソードを繰り返して方策の選択確率を学習。 SarsaとQ学習…