【強化学習】Reward Shaping

一言で言うと 強化学習の通常の報酬値に、追加の値を加えることで、学習速度を向上させることを目指すフレームワーク。 最もシンプルなReard Shapingは、以下のように、通常の報酬値$r$に追加の報酬$F$を加えるような形 $$ r_{rs} = r + F $$ 代表的なReward Shaping Potential-based Reward Shaping Potential-based Rewa…