どこから見てもメンダコ
id:horomary
深層分布強化学習 ②QR-DQN
QR-DQNをtensorflow2で実装します。 元論文: [1710.10044] Distributional Reinforcement Learning with Quantile Regression はじめに Categorical DQNの分布モデル QR-DQNの分布モデル 分位点回帰 分位点Huberloss QR-DQNの実装 QRネットワークの実装 分位点ロスによるネットワーク更新 Breakoutでの学習結果 次:FQF …