中国科学院自动化研究所
丨
智能系统与工程研究中心
立即注册
会员登录
问题反馈
首页
开放平台
陆战兵棋平台
德州扑克平台
在线对抗
技术共享
算法中心
数据中心
AI开发中心
训练中心
信息发布
平台动态
学术动态
业界动态
社区论坛
联系我们
社区论坛
Community Forum
社区论坛
当前位置
>
首页
>
社区论坛
开放平台
第1讲
第2讲
第3讲
第4讲
第5讲
第6讲
第7讲
在线对抗
第1讲
第2讲
第3讲
第4讲
第5讲
第6讲
第7讲
技术共享
第1讲
第2讲
第3讲
第4讲
第5讲
第6讲
第7讲
信息发布
第1讲
第2讲
第3讲
第4讲
第5讲
第6讲
第7讲
专家论坛
第1讲
第2讲
第3讲
第4讲
第5讲
第6讲
第7讲
赛事专区
第1讲
第2讲
第3讲
第4讲
第5讲
第6讲
第7讲
技术讲堂
第1讲
第2讲
第3讲
第4讲
第5讲
第6讲
第7讲
版主:
申生奇,于彤彤,liucw0716
序言
第一期
第二期
第三期
第四期
主题:
第3期第1讲-兵棋推演自博弈与强化学习专题序言
摘要:
本期,我们将系列介绍目前较为主流的博弈AI研发框架,即自博弈+强化学习在兵棋推演上的技术细节与思考,本讲作为序言,介绍本期(第3期)的背景与主要安排。
主讲人:
尹奇跃
2022-02-18 12:37:42
第三期-第1讲
0
0
1049
最新评论:无
主题:
兵棋AI深度强化学习状态特征设计与思考
摘要:
状态表示是进行强化学习的基本要素之一,将将详细介绍如何抽取兵棋引擎中的观察信息并构造特征,以及特征处理神经网络。
主讲人:
于彤彤
2022-02-25 11:39:55
第三期-第2讲
0
0
870
最新评论:无
主题:
兵棋AI深度强化学习动作设计与思考
摘要:
动作表示是进行强化学习的关键要素之一,将介绍以关键点为基础的高效动作设计方案,以及即时动作与长时动作如何使用。
主讲人:
申生奇
2022-03-04 09:20:35
第三期-第3讲
0
0
607
最新评论:无
主题:
兵棋AI深度强化学习奖赏系统设计与思考
摘要:
奖励是强化学习的驱动力,将介绍如何抽取得分面板或状态信息构造奖惩函数,以及为实现多样化AI的多样化奖惩方案。
主讲人:
申生奇
2022-03-10 22:15:08
第三期-第4讲
0
0
512
最新评论:无
主题:
兵棋AI深度强化学习训练方法设计与思考
摘要:
通过网络设计与分布式训练将获得强化学习策略,将介绍基本的网络设计、训练算法、分布式训练、以及一些训练技巧。
主讲人:
申生奇
2022-03-18 16:32:41
第三期-第5讲
0
0
636
最新评论:无
主题:
兵棋AI模仿学习训练方法与思考
摘要:
模仿学习为强化学习与自博弈提供策略初始化,将介绍基本的模仿学习策略以及如何与强化学习友好适配。
主讲人:
于彤彤
2022-03-25 08:53:48
第三期-第6讲
0
1
800
最新评论:田胤
主题:
兵棋AI种群迭代训练与评估方法
摘要:
兵棋AI种群迭代训练与评估方法,将介绍如何构建种群,以缓解策略非传递、红蓝异构且能力非对称下策略迭代的一系列问题
主讲人:
于彤彤
2022-04-01 09:47:39
第三期-第7讲
0
0
539
最新评论:无
共7条 1页
<<
1
>>
发表帖子
陆战平台
德扑平台
讨论交流
反馈答疑
陆战平台
德扑平台
讨论交流
反馈答疑
日常水帖
博弈&学习
AI开发
训练平台
数据共享
平台动态
学术动态
业界动态
反馈建议
黄凯奇
刘伟
百家争鸣
讨论交流
2023庙算杯
2022庙算杯
2021庙算杯
砺智杯
西柏坡邀请赛
庙算·先启
序言
第一期
第二期
第三期
第四期
发表
编辑帖子
0/200
发表
问题反馈
请将您的宝贵意见反馈给我们
立即提交