技术共享

TECHNOLOGY SHARING

提供开源算法 高水平基准AI

训练及复盘数据以及AI开发包等

算法中心 数据中心 AI开发中心 训练中心
MADDPG:

MADDPG

适用场景:

半合作半竞争博弈环境

算法类型:

开源实现

算法简介:

       MADDPG提出了一种适配Actor-Critic的方法,该方法考虑了其他智能体的行动策略,并且能够成功地学习需要复杂的多智能体协调的策略。 此外,提出了一种训练方案,该方案利用针对每个代理的策略集合,从而导致更强大的多智能体策略。                    

参考文献:

[1] Lowe, Ryan, et al. "Multi-agent actor-critic for mixed cooperative-competitive environments." Advances in neural information processing systems. 2017.

算法模块:

maddpg-master.zip

问题反馈
请将您的宝贵意见反馈给我们