社区论坛

Community Forum

技术讲堂
播放:1052 评论:0 发表于:2021-10-22 09:51:05 B站链接:https://www.bilibili.com/video/BV11Q4y1D7o1?spm_id_from=333.999.0.0
摘要:

展示如何基于内置的Demo AI实现一个A2C或PPO算法训练的兵棋AI,涵盖状态空间、动作空间、奖励等要素的设计,并阐述如何快速地实现一个分布式训练版本。

推荐列表:
    立即登录游客您好,可以登录后发布评论哦!
1
回复帖子 返回顶部

请选择对留言操作
删除留言(管理员或楼主)
问题反馈
请将您的宝贵意见反馈给我们