社区论坛详情-人机对抗智能

中国科学院自动化研究所丨智能系统与工程研究中心

立即注册会员登录问题反馈

社区论坛

Community Forum

当前位置 > 首页 > 社区论坛

版主：申生奇,于彤彤,liucw0716

序言第一期第二期第三期第四期

主题：第3期第1讲-兵棋推演自博弈与强化学习专题序言

摘要：本期，我们将系列介绍目前较为主流的博弈AI研发框架，即自博弈+强化学习在兵棋推演上的技术细节与思考，本讲作为序言，介绍本期（第3期）的背景与主要安排。

主讲人：尹奇跃

2022-02-18 12:37:42

第三期-第1讲 0 0 2403 最新评论：无

主题：兵棋AI深度强化学习状态特征设计与思考

摘要：状态表示是进行强化学习的基本要素之一，将将详细介绍如何抽取兵棋引擎中的观察信息并构造特征，以及特征处理神经网络。

主讲人：于彤彤

2022-02-25 11:39:55

第三期-第2讲 0 0 2259 最新评论：无

主题：兵棋AI深度强化学习动作设计与思考

摘要：动作表示是进行强化学习的关键要素之一，将介绍以关键点为基础的高效动作设计方案，以及即时动作与长时动作如何使用。

主讲人：申生奇

2022-03-04 09:20:35

第三期-第3讲 0 0 1647 最新评论：无

主题：兵棋AI深度强化学习奖赏系统设计与思考

摘要：奖励是强化学习的驱动力，将介绍如何抽取得分面板或状态信息构造奖惩函数，以及为实现多样化AI的多样化奖惩方案。

主讲人：申生奇

2022-03-10 22:15:08

第三期-第4讲 0 0 1426 最新评论：无

主题：兵棋AI深度强化学习训练方法设计与思考

摘要：通过网络设计与分布式训练将获得强化学习策略，将介绍基本的网络设计、训练算法、分布式训练、以及一些训练技巧。

主讲人：申生奇

2022-03-18 16:32:41

第三期-第5讲 0 0 1629 最新评论：无

主题：兵棋AI模仿学习训练方法与思考

摘要：模仿学习为强化学习与自博弈提供策略初始化，将介绍基本的模仿学习策略以及如何与强化学习友好适配。

主讲人：于彤彤

2022-03-25 08:53:48

第三期-第6讲 0 1 1708 最新评论：田胤

主题：兵棋AI种群迭代训练与评估方法

摘要：兵棋AI种群迭代训练与评估方法，将介绍如何构建种群，以缓解策略非传递、红蓝异构且能力非对称下策略迭代的一系列问题

主讲人：于彤彤

2022-04-01 09:47:39

第三期-第7讲 0 0 1353 最新评论：无

共7条 1页

1

编辑帖子

0/200

问题反馈

请将您的宝贵意见反馈给我们