谷歌子公司DeepMind生产的“阿尔法狗”战胜围棋大师李世石后,“即时战略游戏”就成为许多人工智能专家眼中的下一个目标。DeepMind宣布将为研究人员提供一个用《星际争霸Ⅱ》测试人工智能的新算法,阿里巴巴也曾开发过一款《星际争霸》的增强学习框架。
可能很多人只关注到人工智能挑战“即时战略游戏”事件本身,而忽略了其在军事方面的重大意义。大多数“即时战略游戏”其实就是一款军事作战指挥模拟软件,比如一些二战系列的游戏,玩家可以通过扮演某个国家的将领,充分体验各军兵种在战争中所发挥的独特作用,犹如亲身亲历那些经典战役。还有一些策略性非常强的游戏,更偏重于对整体战略和局部战术的运用,玩家可以像在沙盘上一样运筹帷幄,指挥调配自己的各种军事力量,运用各种战略战术攻击对方。虽然战斗过程被大大简化,但其对实战分析的模拟程度却相当高。因此,“即时战略游戏”本身对提升军事指挥训练水平有很大助益。
战争是你死我活的对抗,一款真正的军事游戏必须具备高度对抗性。实战对抗游戏的乐趣来自于旗鼓相当的“对手”,因为水平差异所产生的“实力碾压”会破坏游戏本身对抗的乐趣。目前,游戏中自带的人工智能还比较原始,是基于预编程序的规则,没有学习能力,也无法进行训练,一旦被人类对手找到弱点后就很难再取胜。
原始人工智能的另一种情形,是快速从游戏代码中获取信息,同时对屏幕内外所有单位下达指令,“手速”远超人类,可以一直“碾压”人类对手。这种情况下,人类与原始人工智能“对战”很快就会失去兴趣,进步也不快。提高水平的最好办法,就是找到一个旗鼓相当的人类对手,但不同的选手之间水平差别比较大,很难找到一个水平层次相当的对手,更何况是一直陪伴自己共同提高的“伙伴”。
当拥有增强学习能力的人工智能开始挑战“即时战略游戏”时,我们看到了解决上述问题的曙光。人工智能通过成千上万次高强度的训练和比赛,不断积累经验,提升自身水平,找到各种复杂局面下的最优方案。相信用不了几年,人工智能就能轻松击败《星际争霸》游戏中的一般选手。随着DeepMind的强势介入,击败顶级选手将指日可待。
之后,人工智能就可以向军事指挥训练方面拓展。利用情报系统提供的素材和仿真实验得到的大数据,将各类军事作战想定、规则和参数移植到“即时战略游戏”,较为逼真地建立起“蓝军”模拟系统。对抗的一方是真实的指挥员,另一方则是人工智能系统。人工智能通过强化学习将自己打造成为指挥员的“私人教练”,成为一个旗鼓相当的对手,并对指挥员开展个性化培训,让其在每局对战中都能发现自己值得改进的地方。随着指挥员水平的不断提升,人工智能还会自动调整自己的水平,让指挥员一直感受到对抗的乐趣和挑战。
转载请注明出处。