いものやま。
id:yamaimo0625
強化学習について学んでみた。(その9)
久々に。 前回までは、非連想的な問題である、n本腕バンディット問題を扱っていた。 今回からは、元々考えていた、強化学習について学んでみた。(その3) - いものやま。で述べたような状況ーーすなわち、行動の選択によって、状態がどんどん変化していってしまうような状況ーーを考えていく。 状態遷移のモデル ところで…