“星际争霸2”是一款全球流行的即时战略游戏。此类游戏有“战争迷雾”,一方需要猜测和侦察对方的行动,属于“不完美信息博弈”,玩家在任何一个情景中都面临海量选择。这是一个更接近现实世界的复杂虚拟环境。
“阿尔法星”采用基于深度神经网络的机器学习技术。最终版本的“阿尔法星”参加线上测试前累计接受了44天的监督学习,并在实验室环境下频繁与职业选手交战。
据介绍,在“星际争霸2”官网欧洲服务器上,“阿尔法星”使用与人类玩家相同的地图和条件匿名参与游戏,并能在无人干预情况下持续自我改进。为了让测试更公平,团队还根据人类玩家的水平限制了机器的某些能力,比如将“阿尔法星”的动作频率降低到与熟练人类玩家接近,并把它的视野限制在摄像头范围内。
“深层思维”研发团队认为,训练“阿尔法星”的先进方法以及算法架构未来有望用于解决复杂的实际问题,包括天气预测、气候模型计算以及语言理解等。但也有学者对现阶段人工智能挑战战略游戏的能力持保守态度。加拿大纽芬兰纪念大学人工智能学者戴夫·丘吉尔认为,“阿尔法星”仍有许多弱点,比如无法抵御以前从未见过的战略等。
歡迎光臨 比思論壇 (http://108.170.10.237/) | Powered by Discuz! X2.5 |