いものやま。
id:yamaimo0625
強化学習とニューラルネットワークを組合せてみた。(その15)
昨日は関数近似にHMEを使ったSarsa()法の実装を行った。 今日はそれを使って実際に学習を行ってみる。 HMEの構成 学習を行うにあたって、HMEの構成は、TD Learning of Game Evaluation Functions with Hierarchical Neural Architecturesとほぼ同じ構成にした。 すなわち、以下の通り: 階層は1階層 エキスパートネットワ…