mabonki0725の日記
id:mabonki0725
複数エージェントの協調学習に成功している論文を読む
この論文はデモが凄いので結構よく論文が読まれている。これはバークレイ学派 Abbeel達の発表である。 [1706.02275v3] Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments この4つのデモでは、複数のエージェントが協調や敵対を報酬設定によって実現されているのが示されている。 ①協調対話:複数…