作为部分可观测异步智能体协同验证环境,POAC是一个轻量级、灵活、易用的环境,可以由用户配置,以满足不同的实验需求。其支持self-play模式、人机等多种模式。POCA提供了6个不同难度的训练场景,并将基于规则的AI作为对手,其内置包括QMIX,VDN,Qtran,IQL与COMA等在内的代表学习算法。
作为部分可观测异步智能体协同验证环境,POAC是一个轻量级、灵活、易用的环境,可以由用户配置,以满足不同的实验需求。其支持self-play模式、人机等多种模式。POCA提供了6个不同难度的训练场景,并将基于规则的AI作为对手,其内置包括QMIX,VDN,Qtran,IQL与COMA等在内的代表学习算法。