mabonki0725の日記
id:mabonki0725
好奇心を本能的な報酬として解く論文
ランニングできず 英語:Toeic (1) 好奇心による強化学習の論文を読む。 「Curiosity-driven Exploaration by Self-Supervised Prediction」 明示的な報酬を外生的報酬(extrinsic reward)とし、好奇心を本能的な報酬(instrinsic reward)として区別して、明示的な報酬の期待が少ない場合や定かで無い場合は好奇心を指針にす…