对于人工智能来说,优势在于几乎无延迟的反应能力与响应速度,在与人类高手的博弈中,可能双方的决策都十分正确,但是胜利的天平总会一点点的朝AI倾斜,就是因为在每一次的决策中,人类总会比AI慢一拍,无论人类经过怎样的后天努力,都不可能达到ai的反应速度,所以在一轮轮的博弈中,AI单凭借叠加的微小的速度优势就足以胜人类选手(前提是双方的决策水平相同)
我们做决策AI的研究,主要是想要取得策略上的AI自主决策能力。
的确现在AI表现出来的能力,在OODA四个环节上,第一个O和最后一个A明显占优势。
而人类则靠分析、决策、推理,甚至是“直觉”来碾压AI
在专业组的对抗中,专业选手在操作上不输AI,于是从18年到20年,我们在专业组一直看到AI被碾压到尘埃里,翻不了身
另一方面:从人机对抗平台的角度,我们认为人机对抗要提供人和机对等的接口。
而提供对等接口后,我们发现:AI反应速度开,还有它的有效操作高,在AI做出反应的时候,基本是无失误的。
所以下一步的接口调整,我们也在考虑两个方向:
1、提升人的操作(加底层AI)
2、降低AI的操作反应
正好和大家探讨
是不是可以对AI的每一步操作都手动的加上随机的延迟,比如1000步进行的决策放到1002,1003进行执行,尽可能模拟人从 决策到输入 反应的时间?
但是专业级选手的手速其实相当快,甚至会快过AI。
除了操作速度,还有有效点击问题。
专业级选手在速度和有效操作上很强,但一般的选手则会慢和容易误操作。
所以在我现在个人更倾向于辅助选手,增强操作,而不是拉低AI操作水平。
很多AI有这样的问题,特别是脚本化控制的AI。
训练平台和对抗平台,希望能从AI自主决策策略的算法上取得突破。
👍👍明白啦,多谢老师解惑