Ape-XにRNNを導入することでatari環境において圧倒的SotAを叩き出した分散強化学習手法 R2D2（Recurrent Experience Replay in Distributed Reinforcement Learning）をtensorflow＋pythonの分散並列処理ライブラリrayで実装します Recurrent Experience Replay in Distributed Reinforcement Learning | OpenReview はじ…

どこから見てもメンダコ

rayで実装する分散強化学習 ④R2D2