rayで実装する分散強化学習 ④R2D2

Ape-XにRNNを導入することでatari環境において圧倒的SotAを叩き出した分散強化学習手法 R2D2(Recurrent Experience Replay in Distributed Reinforcement Learning)をtensorflow+pythonの分散並列処理ライブラリrayで実装します Recurrent Experience Replay in Distributed Reinforcement Learning | OpenReview はじ…