Prioritized Experience Replay

[1511.05952] Prioritized Experience Replay 論文まとめ Online RLの問題点 遷移(transition)間の依存関係の影響が大きい レアな遷移をすぐに捨ててしまう そこで、 Experience Replay(ER) DQNでは、replay mem.からランダムサンプリングしたミニバッチを使って更新する. ERをより効率的、効果的にするには?? 優先順位…