どこから見てもメンダコ
id:horomary
深層分布強化学習 ③FQF: Fully Parameterized Quantile Function for Distributional RL
単体でRainbow越えを達成した深層分布強化学習手法FQFをtensorflow2で実装します。 はじめに C51 → QR-DQN → IQN FQFとは:いい感じのτを提案する機構付きのIQN FQFネットワークの実装 FQFアーキテクチャ Feature network:特徴抽出ネットワーク Fraction proposal network:分位提案ネットワーク Quantile function netwo…