国际象棋
是一种二人对弈的战术棋盘游戏,是回合制、完美信息博弈。
棋类游戏自古以来就被认为是人类智力活动的象征,计算智能发展以来被用作测试计算机智能发展水平的参考标准。国际象棋由于其自身的博弈特点,非常适合为算法提供基准测试。
国际象棋游戏主要由棋盘、棋子、游戏规则三部分组成。国际象棋的棋盘为正方形,由32个深色和32个浅色方格交替排列组成,每边8个方格。开局时棋手的棋盘右下角必须为白格,具体摆放为白棋后置于白,黑棋后置于黑格。对弈双方各有16枚棋子,分别为一王、一后、双象(象)、双马(马)、双车(车)和八兵。棋局由白方先下,对弈双方轮流移动棋盘上既有的己方棋子。通常,一步棋只能移动一个棋子。玩家的目标是将对方的国王置于无法避免的威胁之下将死对方。国际象棋游戏过程可以分为三个阶段:开局、中局、残局。国际象棋比较经典的战术有堵塞,引离,闪击等。国际象棋共有10^43到10^50种棋局变化。
2017年DeepMind推出著名的AlphaZero,通过从零学习掌握了国际象棋并打败了国际象棋世界冠军。2019年,DeepMind实现的强化学习开源框架open_spiel中包含了国际象棋这一游戏环境。