暇さえあればアルゴリズムいじり
id:yoshishinnze
強調学習の問題設定(ペナルティ与える)
目次 大分経過してしまいましたが、マルチエージェント強化学習(MARL)で前回から更新が止まっていた問題解決までトライアルです。 今回の問題設定について説明していきます。 問題設定 1. 問題の目的 本タスクは、2体のエージェントが共有ターゲット地点に協調して到達することを目的とするマルチエージェント強化学習(MA…