いものやま。
id:yamaimo0625
強化学習とニューラルネットワークを組合せてみた。(その11)
前回はドロップアウトを実装したニューラルネットワークを強化学習の関数近似に使う実験をした。 けど、結果としてはうまくいかなかった。 そこで、次はHMEを強化学習の関数近似に使うのを試してみる。 HMEについては、以下を参照: HMEの出力の重みに関する勾配計算 HMEを強化学習の関数近似に使うためには、誤差関数の重…