开放平台

OPEN PLATFORM

针对不同决策问题

介绍各类决策平台并提供接入方式

学术分类应用分类
平台名称:

围棋

博弈特点:

二人零和博弈;完美信息博弈,回合制。

潜在应用:

金融行业中的风险评估模型、反欺诈、核对账目,医疗领域中的临床诊断鉴别疾病,以及推动军事决策智能化等等。

平台简介:

       棋牌类策略游戏一直以来都被用作测试计算机智能发展水平的参考标准,而围棋由于其复杂性和规则的确定性, 加之游戏环境可控性和完全信息等特性, 吸引了人工智能领域的持续研究。 近期,基于机器学习的博弈对抗算法在棋牌类策略游戏对抗应用中取得了突破性进展, 其中一个标志性事件就是谷歌的DeepMind公司2016年相继提出的AlphaGo系列技术。随后,AlphaGo的团队于2017,介绍了AlphaGo Zero,该版本无需使用人类游戏数据即可创建,并且比任何以前的版本都强大。 AlphaGo及其继任者背后主要的方法是 Value Networks(价值网络)和 Policy Networks(策略网络)。其中 Value Networks 评估棋盘位置,Policy Networks 选择下棋步法。这些神经网络模型通过一种新的方法训练,结合人类专家比赛中学到的监督学习,以及在自己和自己下棋(Self-Play)中学到强化学习。2017年4月21日,记录AlphaGo人机世纪对决的纪录片在纽约翠贝卡电影节上映,展示了人机大战的过程,也探讨了人类思维的工作方式和人工智能未来的工作方式。  


参考文献:
[1] Wang, Fei-Yue, et al. “Where Does AlphaGo Go: From Church-Turing Thesis to AlphaGo Thesis and Beyond.” IEEE/CAA Journal of Automatica Sinica, vol. 3, no. 2, 2016, pp. 113–120.
[2] Silver, David, et al. “Mastering the Game of Go with Deep Neural Networks and Tree Search.” Nature, vol. 529, no. 7587, 2016, pp. 484–489.
推荐阅读
问题反馈
请将您的宝贵意见反馈给我们