技术共享

TECHNOLOGY SHARING

提供开源算法 高水平基准AI

训练及复盘数据以及AI开发包等

算法中心 数据中心 AI开发中心 训练中心
intentMARL:

intentMARL

适用场景:

多智能体博弈

算法类型:

开源实现

算法简介:

       人类物种的成功归功于人们对物质世界和社会环境的显著适应性。人类社会智能赋予我们推理其他人心态的能力,这种心理状态推理广泛影响着我们日常生活中的决策。例如,安全驾驶要求我们推断其他驾驶员的意图并做出相应的决定。这种微妙的意图决策(心智理论)行为在人类活动中无处不在,但即使在最先进的多智能体系统中也很难实现。 

intentMARL该算法是一种意图感知的多智能体规划框架以及学习算法,在此框架下,智能体计划在目标空间中最大化预期效用,并且在规划过程中考虑了其他智能体的意图;算法提出了一个简单但有效的效用函数的近似函数,而不是将学习问题公式化为部分可观察的马尔可夫决策过程。                    

参考文献:

[1] Qi, Siyuan, and Song-Chun Zhu. "Intent-aware multi-agent reinforcement learning." 2018 IEEE International Conference on Robotics and Automation (ICRA). IEEE, 2018.

算法模块:

intentMARL-master.zip

问题反馈
请将您的宝贵意见反馈给我们