大庆做流产油城女子网站,企业网站系统,网页升级紧急通知域名自动跳转,网站怎么添加广告代码来源#xff1a;AI 研习社概要#xff1a;上个月#xff0c;DeepMind和暴雪终于开源了《星际争霸II 》的机器学习平台。本文介绍了基于星际争霸II游戏的强化学习环境SC2LE#xff08;《星际争霸II 》学习环境#xff09;。StarCraft II: A New Challenge for Reinforcemen… 来源AI 研习社概要上个月DeepMind和暴雪终于开源了《星际争霸II 》的机器学习平台。本文介绍了基于星际争霸II游戏的强化学习环境SC2LE《星际争霸II 》学习环境。StarCraft II: A New Challenge for Reinforcement Learning星际争霸 II:增强学习的新挑战上个月DeepMind和暴雪终于开源了《星际争霸II 》的机器学习平台。本文介绍了基于星际争霸II游戏的强化学习环境SC2LE《星际争霸II 》学习环境。论文描述《星际争霸II 》行动和奖励规范并提供一个开源的Python界面用于与游戏引擎进行通信。暴雪提供游戏输入输出的APIDeepMind又做了层基于Python的封装。除了主要的游戏地图他们提供了一套专注于《星际争霸II 》游戏不同元素的迷你游戏。对于主要的游戏地图还提供了一个伴随专业玩家的游戏重播数据数据集。从该数据训练的神经网络的初始基线结果预测游戏结果和玩家行为。文中使用了被称为Blizzard分数的一个中间分数这个分数包含了一个对当前资源、等级以及单位和建筑的加权和如果玩家赢得战斗而且管理好资源这个分数就会单调增加失败的时候这个分数就会减少。此外系统还使用了一系列的特征层为AI编码相关信息比如地形高度、相机位置、屏幕中单位的血量以及各种其他信息。最后提出了应用于《星际争霸II 》的规范深强化学习的初始基线结果。DeepMind之后也会发布上百万帧的选手游戏记录这对模拟环境研究也会有很大的帮助。 classvideo_iframe data-vidtype2 allowfullscreen frameborder0 data-ratio1.7666666666666666 data-w848 scrollingno data-srchttp://v.qq.com/iframe/player.html?vidp0552u5kaxqwidth670height376.875auto0 styledisplay: block; width: 670px !important; height: 376.875px !important; width670 height376.875 data-vh376.875 data-vw670 srchttp://v.qq.com/iframe/player.html?vidp0552u5kaxqwidth670height376.875auto0/ 观看论文解读大概需要 6 分钟学霸们还请自行阅读论文以获得更多细节