游戏“外挂”?—— AI 生成游戏最强攻略
作为一名快乐的肥宅,玩游戏是居家必备,无论是王者荣耀、吃鸡、原神这些大热游戏,还是跳一跳、合成大西瓜、2048、这些风靡一时得小游戏,咱都有涉及。但是为了成为一个“头号玩家”,我总是疯狂的去个各大社区、网站寻找各种攻略,跟着攻略成长,我时常在想,什么时候俺才能成为一代攻略大神啊,让大家学习我的技术,岂不是很刺激!
灵光一闪,毕竟我是个有点小技术的肥宅,曾经也痴迷过 deepmind,跑过 AlphaGo,这不得训练一个 AI 玩一玩。
强化学习训练 2048 游戏,观察 AI 如何找到出口。
既然要练手,那就先从 2048 这种简单,不考验操作,纯策略的游戏入手吧。在网上搜罗了一番,果然让我找到了开源的 2048 游戏环境。
GitHub 地址: https://github.com/rgal/gym-2048
下一步就是把这个算法和强化学习结合了。
算法部分很简单,目前我才用的是最传统的 DQN,10 分钟就可以达到一个还可以的模型效果。如果小伙伴们有想法,可以试试 RainBow,PPO,A2C,SAC 这类算法,相信会获得更佳的效果。
我开发这个模型,用的是来自华为云的 ModelArts(它是一个在线、开箱即用的 AI 平台,还有免费的 GPU 算力,每天不限次数使用,不要太爽!),所以代码是在 ipynb 中跑的。
整体步骤大概可以分为 3 步:
1.创建游戏环境
2.创建 DQN 算法
3.创建网络模型
此处我用的就是一个非常简单的三层卷积网络
完成以上三步,就可以愉快的开始训练啦:
我只训练了 10 分钟,在这个不能错步的严格环境下,推理时可以达到 256 分,如果采用更先进算法,更长的训练时间,2048 不是梦。
详细代码获取方式:点此链接可直接在线运行,或者下载https://marketplace.huaweicloud.com/markets/aihub/notebook/detail/?id=3a11d09b-85f5-4ae4-b4a7-9b19be2b444d
这个技术来源是我在去年华为云 AI 全栈成长计划中接触到的,据说今年华为云又开始了新一轮【AI 实战营】,6 大分类实战营 Python、ModelArts、MindSpore AI 框架、深度、强化、机器学习,助我们成为“AI 王者”!短平快地学习全面 AI 知识的同时,还能拿到 Mate 30Pro、智能手表、无线耳机等惊喜豪礼!我已经扫描下面二维码报名啦~你还要等吗?
版权声明: 本文为 InfoQ 作者【华为云开发者社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/76d0833d9f4271ecc7d86dd9c】。文章转载请联系作者。
评论