开放平台详情-人机对抗智能

平台名称：

足球

博弈特点：

足球是兼具合作与对抗的多智能体完美信息实时博弈。具有较大状态空间、动作空间。

潜在应用：

将AI部署于现实决策场景的一大障碍是目前已有的博弈AI算法往往针对纯对抗性的任务（如围棋、象棋等），但现实世界中的任务往往并不是纯对抗性的，而是既包含了对抗又包含了合作的。在需要合作的任务中，能否高效地进行团队配合，往往会对结果起到关键的作用。正如球赛中，就算球队里没有天才球星，仅靠平庸的球员和高效的团队配合也能大大提高胜率。相反，球技再高超的天才球星也无法让不擅长团队配合的球队取胜。然而，想要让AI既能对抗又能团队配合并不容易：智能体需要同时根据队友、对手的意图来做出最终的决策。目前主流AI算法并不擅长团队合作，常见的用于评估AI的游戏环境（如Atari游戏、围棋、象棋等等）亦无法评估AI是否具备团队配合能力。因此，足球被认为是非常适宜训练和评估AI团队配合能力的环境，在学术界得到一定的应用。

平台简介：

足球具有非常悠久的历史，其前身起源于中国古代山东淄州（今淄博市）的球类游戏“蹴鞠”，后经阿拉伯人由中国传至欧洲，逐渐演变发展为现代足球。在AI领域，足球也被广泛研究。目前学术界主流的实验平台之一是谷歌公司于2019年7月发布的Google Research Football开源环境平台。该平台旨在让强化学习算法通过机器学习掌握足球游戏。该平台使用3D物理引擎模拟足球在现实世界中的运动、撞击等物理现象，在比赛规则方面也完全仿照了现实球赛的足球规则（如球员会因为严重犯规而被红牌罚下）。在面向人工智能的接口方面，该平台同时支持单智能体、多智能体模式，其中单智能体模式下人工智能只能一次控制一名球员（如带球的球员）。在比赛形式上，该平台也同时支持人-机对抗、机-机对抗。此外，该平台还自带了预训练的智能体来供用户来对抗、学习和研究。

平台地址：

http://turingai.ia.ac.cn/data_center/show/13

开源地址：

https://github.com/google-research/football

参考文献：
[1] Karol Kurach, Anton Raichuk, Piotr Stańczyk, Michał Zając, Olivier Bachem, Lasse Espeholt, Carlos Riquelme, Damien Vincent, Marcin Michalski, Olivier Bousquet, Sylvain Gelly: “Google Research Football: A Novel Reinforcement Learning Environment”, 2019; arXiv:1907.11180.