目次大分経過してしまいましたが、マルチエージェント強化学習(MARL)で前回から更新が止まっていた問題解決までトライアルです。今回の問題設定について説明していきます。問題設定 1. 問題の目的本タスクは、2体のエージェントが共有ターゲット地点に協調して到達することを目的とするマルチエージェント強化学習（MA…

暇さえあればアルゴリズムいじり

強調学習の問題設定(ペナルティ与える)