开放平台

OPEN PLATFORM

针对不同决策问题

介绍各类决策平台并提供接入方式

学术分类应用分类
平台名称:

足球

博弈特点:

足球是兼具合作与对抗的多智能体完美信息实时博弈。具有较大状态空间、动作空间。

潜在应用:

         将AI部署于现实决策场景的一大障碍是目前已有的博弈AI算法往往针对纯对抗性的任务(如围棋、象棋等),但现实世界中的任务往往并不是纯对抗性的,而是既包含了对抗又包含了合作的。在需要合作的任务中,能否高效地进行团队配合,往往会对结果起到关键的作用。正如球赛中,就算球队里没有天才球星,仅靠平庸的球员和高效的团队配合也能大大提高胜率。相反,球技再高超的天才球星也无法让不擅长团队配合的球队取胜。然而,想要让AI既能对抗又能团队配合并不容易:智能体需要同时根据队友、对手的意图来做出最终的决策。目前主流AI算法并不擅长团队合作,常见的用于评估AI的游戏环境(如Atari游戏、围棋、象棋等等)亦无法评估AI是否具备团队配合能力。因此,足球被认为是非常适宜训练和评估AI团队配合能力的环境,在学术界得到一定的应用。

平台简介:

       足球具有非常悠久的历史,其前身起源于中国古代山东淄州(今淄博市)的球类游戏“蹴鞠”,后经阿拉伯人由中国传至欧洲,逐渐演变发展为现代足球。 在AI领域,足球也被广泛研究。目前学术界主流的实验平台之一是谷歌公司于2019年7月发布的Google Research Football开源环境平台。该平台旨在让强化学习算法通过机器学习掌握足球游戏。该平台使用3D物理引擎模拟足球在现实世界中的运动、撞击等物理现象,在比赛规则方面也完全仿照了现实球赛的足球规则(如球员会因为严重犯规而被红牌罚下)。在面向人工智能的接口方面,该平台同时支持单智能体、多智能体模式,其中单智能体模式下人工智能只能一次控制一名球员(如带球的球员)。在比赛形式上,该平台也同时支持人-机对抗、机-机对抗。此外,该平台还自带了预训练的智能体来供用户来对抗、学习和研究。


           

参考文献:
[1] Karol Kurach, Anton Raichuk, Piotr Stańczyk, Michał Zając, Olivier Bachem, Lasse Espeholt, Carlos Riquelme, Damien Vincent, Marcin Michalski, Olivier Bousquet, Sylvain Gelly: “Google Research Football: A Novel Reinforcement Learning Environment”, 2019; arXiv:1907.11180.
推荐阅读
问题反馈
请将您的宝贵意见反馈给我们