信息发布

NEWS AND EVENTS

平台动态/最新公告 学术动态 业界动态/赛事

人机对抗智能门户网站发布兵棋推演AI学习环境——强随机与高风险多智能体学习环境

人机对抗是“图灵测试”的重要手段,作为验证机器智能的试金石,为探寻博弈智能生长机制和关键技术验证提供试验环境、评价标准,具有重要科学研究意义和应用价值[1]。开放背景:继 Deepmind 星际争霸智能技术取得突破之后,兵棋推演作为人机对抗的下一个挑战,将牵引智能决策技术新的发展[2],其独特的智能体异步协同、非对称环境决策等挑战性问题吸引着博弈智能研究者的持续关注[3]。为了促进学术界更好针对如上问题开展研究,人机对抗智能门户网站将持续发布兵棋AI学习环境,填补兵棋决策智能研究关键问题基准学习环境空白,满足研究人员对标准学习环境库的需求,推动兵棋推演AI的突破。图1 兵棋AI学习环境库已开放环境:“部分可观测异步智能体协作学习环境”[4],即多智能体不完美信息下异步协作算法学习验证环境(http://turingai.ia.ac.cn/notices/detail/358),其对应多智能体异步协作这一挑战,是目前学界多智能体协作(默认假设同步)更一般化的问题。“可变智能体协作学习”,即实现对抗过程中“多智能体合并为一”以及“单智能体拆分为多”下的新产生的属性变化智能体控制与协作(http://turingai.ia.ac.cn/notices/detail/374),以应对现实世界因各种因素(如追加、失联)等造成的动态变化的智能体协作。本期开放环境:强随机与高风险多智能体学习环境,取自兵棋推演中智能体受强随机因素影响产生的裁决及其带来的高风险收益/代价问题,使得智能体面临不确定的状态转移及奖励回报等挑战。该环境针对当前学界中多智能体环境缺乏随机因素影响的局限而提出,可应用于多智能体高效探索、奖励不确定、安全的多智能体强化学习等问题关键算法验证。环境地址:http://turingai.ia.ac.cn/app/detail/33图2 高随机智能体学习环境走向通用人工智能前路漫漫,让我们共同努力,共同推动智能技术的变革与突破!参考文献:[1] 黄凯奇,兴军亮,张俊格,倪晚成, “人机对抗智能技术”,中国科学:信息科学, 2020, 50(4):540-550.[2] Qiyue Yin, Jun Yang, Wancheng Ni, Bin Liang, KaiqiHuang. AI in Games: Techniques, Challenges and Opportunities, arXiv:2111.07631.[3] 尹奇跃,赵美静,倪晚成,张俊格,黄凯奇. “兵棋推演的智能决策技术与挑战”. 自动化学报,2021,47:1–15.
2022-05-23查看详情

方寸棋盘,点兵励将 ——庙算人机对抗天梯即将开启

决策智能是国家新一代人工智能的重要发展方向,也是实现国家创新发展战略的重要基石。在决策智能的探索道路上,人机对抗已成为国际公认的重要途径之一,既是验证机器智能的试金石,也是人与智能体认知决策能力交互学习与融合发展的重要通道。“庙算·人机对抗平台”自2020年开放以来,已得到众多兵棋爱好者和AI研发人员的认可。平台开放一年多来,汇聚了来自超过两千个单位的1万五千名注册用户。优秀的人类选手与智能体在平台上练兵砺剑,累计对抗数据超过十万余场。为进一步促进人机能力的融合与共同发展,方便大家切磋交流,图灵网即将开启“庙算人机对抗天梯”排行及常态化排位赛事!天梯积分排位是国内外评价各类能力的主流竞技排名方式。Alpha Go,AlphaStar,OpenAI Five等顶级AI均通过围棋、DOTA、星际争霸等天梯赛评估自身的能力。天梯积分不仅用于评估博弈能力,也能有效加强人与人、人与AI之间的互动。通过天梯排行,可以匹配势均力敌的对手、挑战更高等级的对手,为智能体和人类选手带来更专业的对抗,使得人类选手和AI智能体均能够更快积累经验,提升能力。庙算人机对抗天梯分为“兵圣”(人类选手榜)和“谋圣”(AI智能体榜)两种。注册的人/机用户在平台上练习和参与各类赛事,均可获得天梯积分,根据不同积分获得“兵圣”和“谋圣”不同等级(详细积分规则见后续平台发布, http://turingai.ia.ac.cn)。“兵圣”与“谋圣”为平台认定的顶尖人类选手和智能体,进入庙算平台“名人堂”、获得平台证书,并可获得获得庙算系类赛事晋级特别通道或邀请参加赛事活动的机会。庙算人机对抗天梯简介兵圣天梯兵圣天梯设“从戎士、百夫长、仁勇尉、羽林郎、云麾将、冠军侯、兵圣”七个等级。兵圣以下每个等级内设有五个逐级提升的段位。获得“兵圣”称号的顶尖选手将进入庙算平台庙算“名人堂”、获得平台证书,并可获得获得庙算系类赛事晋级特别通道或邀请参加赛事活动的机会。长时间录未登、无对抗积分,兵圣天梯积分将会衰减。谋圣天梯谋圣天梯设“幕僚、谋士、军师、国师、谋圣”五个等级,谋圣以下每个等级设九个段位。智能体在达到某级九段积分后,将向AI Boss发起挑战,挑战获胜后晋级到下一等级。顶尖智能体获得庙算平台“谋圣”称号和证书,并可获得庙算系列赛事智能体晋级特别通道机会。天梯积分的获得人类选手:在庙算平台上的人人、人机对抗练习积分,参与“赛事中心”各项正式赛事(包括院校赛事/省、区域联合赛事、以及平台常态化积分赛事等)均将作为天梯排行的有效积分,对天梯排行上的优胜选手发起跨级挑战还可获得挑战积分。个人账号长时间未登录积分会进行衰减。AI智能体:上传平台并选择“上线”状态的智能体均可进入“谋圣天梯”。智能体在平台上由平台匿名调度进行人机对抗、机机对抗,智能体完成每段对抗局数并且胜率达到晋级线后可升段,九段智能体通过挑战并战胜AI Bos晋升下一等级。智能体等级不进行衰减。常态化天梯赛事参与赛事将获得更好的积分加成,为此,庙算平台近期将在赛事中心推出庙算系列常态化赛事,敬请期待!附:兵圣天梯积分表谋圣天梯积分表注:幕僚:每段至少有100局对抗谋士:每段至少有400局对抗军师:每段至少有800局对抗国师:每段至少有1200局对抗
2022-05-21查看详情

人机对抗智能门户网站发布兵棋推演AI学习环境——可变智能体协作学习

人机对抗是“图灵测试”的重要手段,作为验证机器智能的试金石,为探寻博弈智能生长机制和关键技术验证提供试验环境、评价标准,具有重要科学研究意义和应用价值[1]。开放背景:继Deepmind星际争霸智能技术取得突破之后,兵棋推演作为人机对抗的下一个挑战,将牵引智能决策技术新的发展[2],其独特的智能体异步协同、非对称环境决策等挑战性问题吸引着博弈智能研究者的持续关注[3]。为了促进学术界更好针对如上问题开展研究,人机对抗智能门户网站将持续发布兵棋AI学习环境,填补兵棋决策智能研究关键问题基准学习环境空白,满足研究人员对标准学习环境库的需求,推动兵棋推演AI的突破。图1 兵棋推演AI学习环境库已开放环境:人机对抗门户网站已发布“部分可观测异步智能体协作学习环境”[4],即多智能体不完美信息下异步协作算法学习验证环境(http://turingai.ia.ac.cn/notices/detail/358),其对应多智能体异步协作这一挑战,是目前学界多智能体协作(默认假设同步)更一般化的问题。本期开放环境:本次发布的学习环境对应兵棋推演中智能体因聚合与解聚合造成的可变化智能体协作问题,即如何实现对抗过程中“多智能体合并为一”以及“单智能体拆分为多”下的智能体控制与协作,需要有效控制新产生的、变化属性的智能体。环境地址:http://turingai.ia.ac.cn/app/detail/32该环境设定具有以下特点:·     多智能体协作更一般化设定。相比于传统如星际争霸微操等典型多智能体协作环境,可变智能体协作可以模拟非定式智能体协作,是更一般化的多智能体协作设定。·     对多智能体协作算法提出了新的挑战。目前的多智能体协作算法在训练过程中假设智能体数目不发生变化,针对可变智能体协作,当前主流算法无法直接迁移。·     更广泛的应用场景。可变智能体协作的研究符合现实中更广泛的应用场景,往往需要应对因各种因素(如追加、失联等)造成的动态变化的智能体协作。图2 可变智能体协作学习环境走向通用人工智能前路漫漫,让我们共同努力,共同推动智能技术的变革与突破![1] 黄凯奇,兴军亮,张俊格,倪晚成, “人机对抗智能技术”,中国科学:信息科学, 2020, 50(4):540-550.[2] Qiyue Yin, Jun Yang, Wancheng Ni, Bin Liang, KaiqiHuang. AI in Games: Techniques, Challenges and Opportunities, arXiv:2111.07631.[3] 尹奇跃,赵美静,倪晚成,张俊格,黄凯奇. “兵棋推演的智能决策技术与挑战”. 自动化学报,2021,47:1–15.[4] Meng Yao, Qiyue Yin, Jun Yang, Tongtong Yu, ShengqiShen, Junge Zhang, Bin Liang, Kaiqi Huang. The Partially ObservableAsynchronous Multi-Agent Cooperation Challenge, arXiv:2112.03809.
2022-04-01查看详情

2022元旦献礼:人机对抗智能门户网站发布开源复杂博弈基准AI子库——百级规模兵棋博弈AI库WargameAILib_1.0

决策智能是国家新一代人工智能的重要发展方向,也是实现国家创新发展战略的重要基石。在决策智能的探索道路上,人机对抗已成为国际公认的重要途径之一。一、开源目标复杂博弈场景下的AI研究是决策智能的前沿方向,也是其服务于国家创新发展战略的重要内容。业界通过举办各类人机对抗品牌赛事,实现复杂博弈场景下AI能力牵引与评估评测。为助力各类赛事的举办与长期发展,牵引决策智能技术攻关、推动技术转化应用,人机对抗智能门户网站发布开源复杂博弈基准AI库。人机对抗智能门户网站根据不同场景应用需求,分阶段逐次发布基准AI库。兵棋推演作为决策智能技术的有效验证环境,其决策要素多维耦合,对抗环境瞬息万变,是开放复杂、高动态博弈场景的有效模拟。兵棋博弈在组赛、组训和AI研发自评估等方面临着基准AI的巨大缺口,为此,图灵网第一阶段开源百级规模兵棋博弈基准AI库:WargameAILib_1.0。二、AI库内容WargameAILib_1.0分为对抗地图、对抗样式、对抗规模和对抗水平四个维度,共包括192个基准AI。包括山岳丛林、水网稻田、高原通道、中等起伏、城镇居民、岛上台地等6种对抗地图;涉及遭遇战、进攻战和防御战等3种对抗样式;涵盖1V1、3V3、6V6、10V10、20V20和30V30等6种对抗规模;分为入门级和进阶级2种对抗水平。图1 WargameAILib_1.0维度三、AI库特点图2 WargameAILib_1.0特点四、AI库使用WargameAILib_1.0已在图灵网AI开发中心正式开源,下载地址见:http://turingai.ia.ac.cn/ai_center/show/11组赛支持:WargameAILib_1.0为兵棋博弈品牌赛事组织提供想定和参赛基准AI支持,以庙算平台赛事为例,WargameAILib_1.0已内置在平台,用户可直接选择场景与基准AI作为比赛想定和参赛AI配套。AI开发:1)WargameAILib_1.0为学习型AI训练提供多样、分级对手模型;    2)用户可在WargameAILib_1.0基准AI上进行功能扩展和策略调整,实现二次开发;3)以WargameAILib_1.0为基础,用户可根据专有领域业务需求,设计环境约束、集成相关算法,研发定制化AI系统。五、联系我们电话:010-82544577;18611336620邮箱:crise-tech-service@ia.ac.cn联系人:赵美静 尹奇跃地址:北京市海淀区中关村东路95号智能化大厦4层智能系统与工程研究中心人机对抗智能门户网站(图灵网):http://turingai.ia.ac.cn/图灵网技术共享社区论坛:http://turingai.ia.ac.cn/bbs/detail/11图灵网技术讲堂:http://turingai.ia.ac.cn/bbs/detail/15庙算人机对抗平台:http://wargame.ia.ac.cn/main庙算·智胜即时策略人机对抗平台AI开发指南:http://wargame.ia.ac.cn/handbookWargameAILib_1.0开发者:赵美静、张海东、戴松、王彤、汪德日、姚远、郭圆。走向通用人工智能前路漫漫,让我们共同努力,共同推动智能技术的变革与突破!
2021-12-31查看详情

人机对抗智能门户网站发布兵棋推演AI学习环境——部分可观测异步智能体协作问题学习环境(POAC)

决策智能是国家新一代人工智能的重要发展方向,也是实现国家创新发展战略的重要基石。在决策智能的探索道路上,人机对抗已成为国际公认的重要途径之一[1]。开放背景:继星际争霸人机对抗突破之后,兵棋推演作为人机对抗的下一个挑战,将牵引智能决策技术新的发展[2]。兵棋推演的智能决策技术与挑战[3]一文指出了兵棋AI研发的挑战问题如算子异步协同、非对称环境决策等,为了促进学术界更好针对如上问题开展研究,人机对抗智能门户网站将持续发布兵棋AI学习环境,填补兵棋决策智能研究关键问题基准学习环境空白,满足研究人员对标准学习环境库的需求,推动兵棋推演AI的突破。环境库介绍:依托人机对抗智能门户网站开放平台,学习环境库将持续发布兵棋关键问题对应的标准学习环境集,包括但不局限:部分可观测异步智能体协同、非对称环境智能体进化学习等。图1 兵棋推演AI学习环境库本期开放环境:本次发布的学习环境对应兵棋算子间高效协同与对抗问题,即如何实现不完美信息下异步算子之间的协作[4]。环境地址←请点击,可参考图灵网技术讲堂第2期第2讲。图2 部分可观测异步智能体协作学习环境POAC汇聚人机对抗平台测评环境、共享人机对抗最新技术成果。走向通用人工智能前路漫漫,让我们共同努力,共同推动智能技术的变革与突破![1] 人机对抗智能技术,中国科学:信息科学,http://scis.scichina.com/cn/2020/N112019-00048.pdf.[2] AI in Games: Techniques, Challenges and Opportunities,https://arxiv.org/abs/2111.07631.[3] 兵棋推演的智能决策技术与挑战,自动化学报,http://www.aas.net.cn/cn/article/doi/10.16383/j.aas.c210547.[4] The Partially Observable Asynchronous Multi-Agent Cooperation Challenge, https://arxiv.org/abs/2112.03809.
2021-12-09查看详情

人机对抗AI训练场开发教程发布:手把手教你使用训练场、开发分布式AI,诚邀体验!

决策智能是国家新一代人工智能的重要发展方向,也是实现国家创新发展战略的重要基石。在决策智能的探索道路上,人机对抗已成为国际公认的重要途径之一。由中科院自动化所智能系统与工程研究中心发布的人机对抗智能门户网站致力于汇聚人机对抗平台环境,共享人机对抗技术成果,发布人机对抗领域最新消息,从而推动人机对抗智能技术生态建设与发展。日前,人机对抗AI训练场已完成功能更新。根据近期开发用户的反馈,本文特提供训练平台以及分布式兵棋AI算法开发的使用教程。通过本教程,研发人员可以快速掌握分布式学习型兵棋智能体开发及训练技巧,从而自主实现更高水平兵棋智能体研发。 本次教程主要分为人机对抗AI训练场视频教程与分布式AI算法开发文字教程。一、关于人机对抗AI训练场的使用基本使用视频教程内容涵盖了从项目创建到获得相应智能体,以及智能体进行进阶调试与训练的完整流程。具体操作包括项目创建,Fork项目,在线训练,一键评估,查看上传排行榜等常用功能。您可以观看以下视频了解如何通过五步操作,完成智能体训练目标:二、关于分布式AI开发关于基准AI的开发需要一定的代码基础,教程内容具有一定的挑战性。完成教程学习后,您将了解如何依托“庙算·智胜”即时策略兵棋人机对抗平台提供的对抗环境和想定(5V5想定(2010431153)),实现一个基于impala的分布式兵棋强化学习AI。 教程主要内容包含impala算法与ray框架,代码架构梳理,代码执行与重要参数说明,强化学习要素,网络设计与决策,控制模块,强化学习训练等内容。详情请见图灵网论坛:http://turingai.ia.ac.cn/threads/detail/464本次教程由康雅萱,姚蒙提供。欢迎大家试用人机对抗AI训练场,诚邀各位专家挑战人机对抗AI训练场在线训练的智能体排行榜并在论坛进行更多的交流。人机对抗AI训练场申请试用地址:http://turingai.ia.ac.cn/training_center全新界面,更多功能,更优体验,人机对抗AI训练场新版本来啦!本次更新新增了代码在线编辑、智能体在线评估、标准想定与分布式强化学习训练等功能,优化了用户体验。在AI训练场新版本中,您可以在线进行源码编辑→分布式训练→推演评估等操作,实现兵棋与德州扑克智能体从0到1的全流程开发、训练与评估。汇聚人机对抗平台测评环境、共享人机对抗最新技术成果。走向通用人工智能前路漫漫,让我们共同努力,共同推动智能技术的变革与突破!
2021-12-09查看详情

《庙算 陆地指挥官》部分规则修订公告

2021年11月29日,推演环境对“同格交战”,“引导射击”,“改变机动状态”相关规则进行了以下修订:1. 改变机动状态  修订后规则原文:1.1.ⅳ 地面算子在机动转停止过程中,可以进行改变机动状态(模式)的动作;包括切换至:正常机动,行军,一级冲锋,二级冲锋,掩蔽,半速;差异:旧规则下地面算子必须处于静止状态下进行机动状态的转换。修订后地面算子可以在机动转停止过程中改变机动状态。2. 同格交战修订后规则原文:15.a 当同一六角格内存在双方地面算子时,触发同格交战规则,格内地面算子处于同格交战状态,自动按距离为0格进行直瞄射击裁决;将自动选择攻击等级最高的武器进行打击,裁决顺序按照先进入该六角格的算子先实施打击;其打击目标的选择按照“坦克”>“战车”>“其他车辆”>“人员”的优先顺序自动选择;当存在同类型多个目标时,优先选择班组数少的算子进行打击(同类目标班组数相同则随机选择)。差异:旧规则下同格交战规则规定特定算子只能使用特定的武器进行打击(如:步兵使用步兵轻武器,坦克使用直瞄炮等)。修订后同格交战规则将自动选择算子携带的,有弹药剩余的,当前状态下产生最高攻击等级的武器进行战斗。3. 引导射击修订后规则原文:3.d 引导算子进行引导射击,不会退出掩蔽;被引导算子进行引导射击仍会解除掩蔽状态。差异:如果算子在引导射击之前处于掩蔽状态,在引导射击之后将不再退出掩蔽状态。请各位AI开发者在官网下载最新AI开发sdk(wargame.ia.ac.cn)
2021-11-29查看详情

庙算人机对抗平台赛事中心正式开放

人机对抗是验证机器智能的试金石,机机、人机、人混等各类对抗赛事是评估能力水平、促进技术发展的有效手段,也是人机对抗智能技术生态的重要组成。为更好推动人机对抗智能技术,庙算人机对抗平台特推出“赛事中心”版块,支持各团体定制并自主开展博弈赛事组织、智能博弈技术评估等工作。“赛事中心”为赛事组织者提供了信息发布、用户管理、数据管理、赛程定制等功能,支持不同的团体在平台上组织开展个性化的赛事,并按赛事进行数据隔离,保障赛事数据的私密性。“赛事中心”具体功能包括:一、赛事管理。获得赛事管理员权限的账户,可通过赛事管理后台定制个性化赛程,查看并管理参赛人员信息、赛事复盘记录、比赛积分和成绩记录等。平台支持赛事管理员编辑制定赛程,也为管理员提供了循环赛赛程自动生成工具。此外,赛事管理员还可以在对抗过程中实时监控比赛进程,以导演权限观摩比赛对抗。二、赛事信息发布。赛事中心为每个赛事提供包含大赛简介、新闻公告、赛事安排、奖项设置、排行榜等功能的赛事首页,支持赛事管理员通过后台编辑和发布赛事通知公告、成绩排行等重要信息。各赛事还可为本赛事设计宣传海报,推送到平台的首页进行宣传,使平台的用户获得公开赛事信息,报名参赛。三、公开/私有赛事管理。庙算平台通过权限管理保障赛程、用户、复盘等赛事数据的私密性。此外还为团体提供了“公开”和“私有”两类赛事模式:“公开”赛事可依托平台发布和宣传,吸引参赛人员;“私有”赛事则通过“赛事验证码”限制参赛知悉范围,只向具有权限的人员开放访问,保证私密性。赛事中心使用流程汇聚人机对抗平台测评环境、共享人机对抗最新技术成果。走向通用人工智能前路漫漫,让我们共同努力,共同推动智能技术的变革与突破!
2021-10-27查看详情

人机对抗AI训练场新版本上线:全新界面,更多功能,更优体验!

决策智能是国家新一代人工智能的重要发展方向,也是实现国家创新发展战略的重要基石。在决策智能的探索道路上,人机对抗已成为国际公认的重要途径之一。由中科院自动化所智能系统与工程研究中心发布的人机对抗智能门户网站致力于汇聚人机对抗平台环境,共享人机对抗技术成果,发布人机对抗领域最新消息,从而推动人机对抗智能技术生态建设与发展。全新界面,更多功能,更优体验,人机对抗AI训练场新版本来啦!本次更新新增了代码在线编辑、智能体在线评估、标准想定与分布式强化学习训练等功能,优化了用户体验。在AI训练场新版本中,您可以在线进行源码编辑→分布式训练→推演评估等操作,实现兵棋与德州扑克智能体从0到1的全流程开发、训练与评估。本次更新的具体功能如下: 1. 代码在线编辑您是否在初入AI开发大门时,反复修改代码与配置文件、打包、部署……花费了太多时间在调试呢?为了应对多元的用户使用场景,对各阶段的算法学习者都提高普适性,训练场现已上线在线代码编辑功能。免去了繁琐的项目配置步骤,提供自助式的参数配置模块,让从零开发更轻松。目前平台支持md,py,txt等主流格式的文件编辑;完成编辑后,您可以一键启动训练,轻松get属于您自己的兵棋推演AI或德扑AI项目。图1:在线编辑页面2. 智能体在线评估新版本训练场中,我们可以直接对训练完毕的智能体进行评估。在评估系统中,您可以自定义局数,将您的智能体与内置的智能体对抗,通过分析对抗结果的胜率曲线以及分数,评估智能体的实战水平。作为对手的内置智能体目前包括知识型AI,学习型AI以及DemoAI。多方对战,多方评估,让您的AI能力更加稳健!图2:评估曲线3. 标准想定与分布式训练功能训练场在此前的Mini Games想定的基础上,新增开放了标准想定,并上线标准想定的分布式训练功能。兵棋开发的常见困难如单机训练耗时耗力难以收敛、多机训练开发难度高等,人机对抗AI训练场的分布式训练功能轻松解决。模型迭代周期大大缩短,快速上手分布式AI开发不是梦。图 3 标准想定与分布式资源配置 目前AI训练场采用申请-审核机制,审核通过后,每个用户拥有五天的试用时间。用户可通过智能门户网站训练中心点击申请使用。欢迎申请,高效的AI开发大门向您打开。欢迎留言提出建议,帮助我们提供更好的服务~汇聚人机对抗平台测评环境、共享人机对抗最新技术成果。走向通用人工智能前路漫漫,让我们共同努力,共同推动智能技术的变革与突破!
2021-10-27查看详情
推荐阅读
问题反馈
请将您的宝贵意见反馈给我们