MADDPG
半合作半竞争博弈环境
开源实现
MADDPG提出了一种适配Actor-Critic的方法,该方法考虑了其他智能体的行动策略,并且能够成功地学习需要复杂的多智能体协调的策略。 此外,提出了一种训练方案,该方案利用针对每个代理的策略集合,从而导致更强大的多智能体策略。
[1] Lowe, Ryan, et al. "Multi-agent actor-critic for mixed cooperative-competitive environments." Advances in neural information processing systems. 2017.