算法详情-人机对抗智能

适用场景：

半合作半竞争博弈环境

算法类型：

开源实现

算法简介：

MADDPG提出了一种适配Actor-Critic的方法，该方法考虑了其他智能体的行动策略，并且能够成功地学习需要复杂的多智能体协调的策略。此外，提出了一种训练方案，该方案利用针对每个代理的策略集合，从而导致更强大的多智能体策略。

开源实现：

https://github.com/openai/maddpg

参考文献：

[1] Lowe, Ryan, et al. "Multi-agent actor-critic for mixed cooperative-competitive environments." Advances in neural information processing systems. 2017.

算法模块：

maddpg-master.zip