开放平台

OPEN PLATFORM

针对不同决策问题

介绍各类决策平台并提供接入方式

学术分类应用分类
平台名称:

雅达利

博弈特点:

雅达利游戏主要为单人小游戏,博弈特点为实时制/完美信息博弈/人物博弈/非零和博弈。

潜在应用:

        适用于强化学习算法的基准测试环境,可迁移至实际应用场景中,例如军事,金融,体育,机器人等。

平台简介:

       Atari 2600是Atari公司于1977年发布的视频游戏。该游戏机包含一系列热门游戏,例如Breakout,Ms. Pacman 和Space Invaders。自从Mnih等人介绍了Deep Q-Networks,2013年,Atari 2600已成为测试新强化学习算法的标准环境。由于Atari 2600的高清视频输入(尺寸为210 x 160,频率为60 Hz)以及游戏之间的任务差异,它一直是具有挑战性的测试平台。 Atari 2600环境最初是通过Arcade学习环境(ALE)提供的。OpenAI Gym封装了这些环境,以创建更加标准化的界面。OpenAI Gym提供59种Atari 2600游戏作为环境。研究人员普遍认为雅达利 2600 系列游戏是用于评定 RL 表现的一个很好的基准,因为每款游戏都足以代表一个实际的挑战,而整个系列包含非常多品种,提供足够的多样化。 


                

参考文献:
[1] Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A. A., Veness, J., Bellemare, M. G., ... & Petersen, S. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540), 529.
[2] Mnih, V., Kavukcuoglu, K., Silver, D., Graves, A., Antonoglou, I., Wierstra, D., & Riedmiller, M. (2013). Playing atari with deep reinforcement learning). arXiv preprint arXiv:1312.5602.
[3] Hausknecht, M., & Stone, P. (2015, September). Deep recurrent q-learning for partially observable mdps. In 2015 AAAI Fall Symposium Series.
[4] Van Hasselt, H., Guez, A., & Silver, D. (2016, March). Deep reinforcement learning with double q-learning. In Thirtieth AAAI Conference on Artificial Intelligence.
[5] Wang, Z., Schaul, T., Hessel, M., Hasselt, H.V., Lanctot, M., & Freitas, N.D. (2016). Dueling network architectures for deep reinforcement learning. ICML.
[6] Hessel, M., Modayil, J., Van Hasselt, H., Schaul, T., Ostrovski, G., Dabney, W., ... & Silver, D. (2018, April). Rainbow: Combining improvements in deep reinforcement learning. In Thirty-Second AAAI Conference on Artificial Intelligence.
[7] 官网链接 https://gym.openai.com
[8] GitHub链接:https://github.com/openai/gym
推荐阅读
问题反馈
请将您的宝贵意见反馈给我们