开放平台详情-人机对抗智能

平台名称：

雅达利

博弈特点：

雅达利游戏主要为单人小游戏，博弈特点为实时制/完美信息博弈/人物博弈/非零和博弈。

潜在应用：

适用于强化学习算法的基准测试环境，可迁移至实际应用场景中，例如军事，金融，体育，机器人等。

平台简介：

Atari 2600是Atari公司于1977年发布的视频游戏。该游戏机包含一系列热门游戏，例如Breakout，Ms. Pacman 和Space Invaders。自从Mnih等人介绍了Deep Q-Networks，2013年，Atari 2600已成为测试新强化学习算法的标准环境。由于Atari 2600的高清视频输入（尺寸为210 x 160，频率为60 Hz）以及游戏之间的任务差异，它一直是具有挑战性的测试平台。 Atari 2600环境最初是通过Arcade学习环境（ALE）提供的。OpenAI Gym封装了这些环境，以创建更加标准化的界面。OpenAI Gym提供59种Atari 2600游戏作为环境。研究人员普遍认为雅达利 2600 系列游戏是用于评定 RL 表现的一个很好的基准，因为每款游戏都足以代表一个实际的挑战，而整个系列包含非常多品种，提供足够的多样化。

平台地址：

http://turingai.ia.ac.cn/data_center/show/13

开源地址：

https://www.endtoend.ai/envs/gym/atari/

参考文献：
[1] Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A. A., Veness, J., Bellemare, M. G., ... & Petersen, S. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540), 529.
[2] Mnih, V., Kavukcuoglu, K., Silver, D., Graves, A., Antonoglou, I., Wierstra, D., & Riedmiller, M. (2013). Playing atari with deep reinforcement learning). arXiv preprint arXiv:1312.5602.
[3] Hausknecht, M., & Stone, P. (2015, September). Deep recurrent q-learning for partially observable mdps. In 2015 AAAI Fall Symposium Series.
[4] Van Hasselt, H., Guez, A., & Silver, D. (2016, March). Deep reinforcement learning with double q-learning. In Thirtieth AAAI Conference on Artificial Intelligence.
[5] Wang, Z., Schaul, T., Hessel, M., Hasselt, H.V., Lanctot, M., & Freitas, N.D. (2016). Dueling network architectures for deep reinforcement learning. ICML.
[6] Hessel, M., Modayil, J., Van Hasselt, H., Schaul, T., Ostrovski, G., Dabney, W., ... & Silver, D. (2018, April). Rainbow: Combining improvements in deep reinforcement learning. In Thirty-Second AAAI Conference on Artificial Intelligence.
[7] 官网链接 https://gym.openai.com
[8] GitHub链接：https://github.com/openai/gym