信息发布

NEWS AND EVENTS

平台动态/最新公告 学术动态 业界动态

陆战平台新增面向强化学习的三个MiniGame

发布时间: 2021-01-04

  

兵棋作为具有战争迷雾特性的即时战略任务被广受关注,但由于其巨大的动作空间和状态空间让普通研究人员望而却步,为促进兵棋推演学习及兵棋AI研究,便于更多兵棋爱好者研发兵棋AI算法,庙算·智胜陆战兵棋平台推出三个MiniGame对抗场景,同时提供其对应的离线训练工具包,欢迎兵棋爱好者下载使用。下载地址:

http://wargame.ia.ac.cn/aiinfo

通过在Mini想定对算法开展研究,了解兵棋AI技术背后的魅力!

(一)单Agent对抗场景

屏幕截图 2020-12-28 110340化边框.jpg

想定简介:

该场景为山岳丛林中23*13大小地域上的一场坦克遭遇对抗。

红蓝双方使用相同型号配置的坦克,其目的均为攻占地图中心的任务夺控点(将夺控点上绿色旗帜变为己方颜色,夺控点上绿色旗帜变为己方颜色时表明已完成夺控)。双方在攻防过程中需要利用地形的遮蔽保存自己,同时尽可能杀伤对手。

(二)多Agent对抗场景1

图片2.jpg

想定简介:

该场景为红蓝两支小队在山岳丛林中23*13大小地域上执行任务,遭遇的一场对抗(地图与单Agent场景相同)。

红蓝双方小队各配备一辆“重型坦克”、一辆“重型战车”,以及一组人员“步兵小队”,其目标均为攻占并控制地图中心的两个夺控任务点(夺控点上绿色旗帜变为己方颜色时表明已完成夺控)。坦克、战车和人员有各自不同的武器和对抗特点,在利用地形的同时通过相互协同配合歼灭对手,尽可能在消耗敌方有生力量的同时保存自己的战力,夺取任务点,取得对抗的胜利。

(三)多Agent对抗场景2

图片2.jpg

想定简介:

此对抗场景与多Agent对抗场景1相同,为红蓝两支小队在山岳丛林中23*13大小地域上执行任务,遭遇的一场对抗,其差别在于中型战车携带的武器不同。

在本场景中,中型战车携带“重型导弹”,该类武器具有“引导射击”功能,可利用步兵的观察和引导,对位于“重型导弹”火力范围内,战车无法直接瞄准但步兵具有瞄准条件的敌方目标实施攻击。与多Agent对抗场景1相比,本对抗中增加了步兵与战车之间的协同攻击的方式,期待可以被强化学习探索获得。

(四)对抗场景中的地图与地形

两个Mini Game对抗场景均使用同一张地图。地图上的最小里程单位以六角格表示,对抗场景地图大小为长23格,宽13格。每个六角格上带有不同的地形属性,具体如下:

高程:高程代表该位置的相对于基准海平面而言的高度,在六角格上用颜色和数字标识,颜色越深表示高程越高,数字表示具体的高程值。高程影响算子的机动值与机动速度(相邻两六角格,高差越大,所需机动值越多,机动速度越慢);会形成对视野的遮挡而产生隐蔽的效果;还会对射击的效果产生影响,通常来说从高处打低处会取得更好的对敌毁伤效果,反之则削弱对敌的毁伤。

4.jpg

地物:地物包括特殊地形(居民地,从林地,湖泊,河流,松软地等),公路、铁路等,如下图所示。每种地形都会对算子动作造成一定的影响,比如降低通行速度,改变被观察距离,降低打击效果等。而当沿公路或铁路机动时,则不会受到高程、从林地、松软地等特殊地形对机动速度的影响;车辆“行军”动作必须沿着公路线或铁路线才能实施(行军速度可达到普通机动速度的2倍)。

5.jpg  6.jpg  7.jpg

城镇地                       从林地                        公路

8.jpg  9.jpg  10.jpg

河流                         湖泊                        松软地

夺控点:夺控点用旗帜标识,算子到达夺控点,当夺控点上及夺控点相邻格(六边)没有对手算子时,可发出“夺控(occupy)”动作,将夺控点上的旗帜变更为己方颜色,视为控制夺控点。当游戏结束时刻,夺控点上旗帜颜色一方将获得高分奖励。

11.jpg  12.jpg

主要夺控点(80分)            次要夺控点(50分)

(五)对抗场景中的算子与武器

两个Mini Game涉及坦克、战车和步兵三类算子。每类算子又各自携带不同的武器。

  坦克:

· 坦克携带中号直瞄跑,车载轻武器和炮射导弹,装备高等级的复合装甲。

· 中号直瞄炮可以行进间射击,对车辆单位造成大量伤害。车载轻武器是对人员打击的主要武器,可以行进间射击。炮射导弹也可以对车辆单位造成大量伤害,但是坦克必须处于静止状态才可使用。

· 坦克有拥有高机动能力,并具有行进间射击(可在机动中实施射击)的能力,是战场上最灵活的算子。

  战车:

· 战车携带车载轻武器,小号直瞄炮,近射炮,车载导弹,装备重型装甲。

· 车载轻武器和近射炮是对人员打击的主要武器。小号直瞄炮和车载导弹是对车辆打击的主要武器。车载导弹具有打击目标距离约远伤害越高的特点。

· 战车拥有高机动能力,但不可以行进间射击,所有打击动作必须在静止状态下完成。

· 战车还具备携带人员的能力,可携带最多一个步兵算子,将步兵快速送达任务地点。但是当携带人员的战车算子受到伤害时,车上的步兵算子同样收到相同的伤害。   

  步兵:

· 步兵携带步兵轻武器,火箭筒,便携导弹。

· 轻武器主要对人员打击,火箭筒和便携导弹主要对车辆单位进行打击。

· 步兵单位机动力较差,需要配合战车才能快速到达任务地点,步兵机动速度不受地形影响。

· 步兵无装甲,但是由于步兵目标小,大部分针对车辆单位的武器无法对步兵造成大量伤害,因此在实际中步兵的生存能力较强,常用于在不利车辆机动地形上前出侦察,或是坚守夺控点。

· 由于步兵目标小,其隐蔽性好,步兵最远被观察距离为10格,车辆则最远可以被距离25格的敌方观察到,当步兵在隐蔽地形(居民地、从林地)实施“掩蔽”动作后,对手需要接近到2格的范围内才能发现隐藏的步兵,因此能发挥很好的侦察、引导打击以及埋伏打击作用。

· 步兵单位不可行军,但是可以进行一级冲锋二级冲锋,可以更快的速度机动,但是步兵冲锋后会很快疲劳,无法长时间实施冲锋。

(六)一些常用的算子动作

          掩蔽:坦克、战车、人员均可实施“掩蔽”动作,完成掩蔽动作后自身被观察距离会减半,但如果敌方从更高的高处往下观察,则掩蔽作用无效。

          行军:坦克、战车可实施“行军”动作,行军动作机动速度为普通机动的两倍,但是要求在武器必须为“锁定”的状态,只能沿公路进行行军,在行军状态下遭受攻击会产生更大的战损,且行军状态下由于武器锁定,不能实施射击。

          行进间射击:坦克在机动过程中,发现目标在射程范围内即可在机动的状态下实施间射击

          引导射击:在战车配备重型导弹情况下,且满足可发射导弹的条件(静止状态、武器展开且冷却完毕),其所属步兵可以引导战车使用重型导弹实施打击。引导射击的执行条件为:步兵可以观察到敌方,且位于战车中型导弹的火力范围内,此时即时战车无法直接瞄准敌方,仍然可以通过步兵引导实施打击。

更多详细的推演规则请见完整推演规则手册


(七)资源链接

开发包、编程开发指南文档下载链接见:http://wargame.ia.ac.cn/aiinfo

问题反馈
请将您的宝贵意见反馈给我们