からっぽのしょこ
id:anemptyarchive
3.1.1:報酬の期待値計算【ゼロつく4のノート】
はじめに 『ゼロから作るDeep Learning 4 ――強化学習編』の独学時のまとめノートです。初学者の補助となるようにゼロつくシリーズの4巻の内容に解説を加えていきます。本と一緒に読んでください。 この記事は、3.1.1節の内容です。報酬の期待値の計算から同時分布と条件付き分布の関係を確認します。 【前節の内容】 www.a…