写点什么

智能对联模型太难完成?华为云 ModelArts 助你实现!手把手教学

发布于: 2021 年 02 月 01 日

作者:胡琦


摘要:农历新年将至,听说华为云 AI 又将开启智能对对联迎接牛气冲天,让我们拭目以待!作为资深 Copy 攻城狮,想要自己实现一个对对联的模型,是不能可能完成的任务,因此我搜罗了不少前人的实践案例,今天想和大家分享的是 和鲸社区的 rua 年糕 贡献的项目-AI 对联,基于 ModelArts 的 「我的笔记本」实现。


一、环境准备


准备环境前,先唠叨几句:ModelArts 是面向开发者的一站式 AI 开发平台,ModelArts 在人工智能三要素中都有非常出色的表现,数据方面提供海量数据预处理及半自动化标注,算法方面除了开发者自己开发还=提供大量的预置算法和订阅算法可供选择,算力方面目前开发环境提供免费算力以及即点即用的「我的笔记本」。目前个人比较中意的功能就是「我的笔记本」,如果您体验过 MindSpore 教程的 「Run in ModelArts」,您会发现其实教程中链接的就是 ModelArts 的 「我的笔记本」模块,具体体验可阅读我的历史文章5分钟在线体验MindSpore的图层IR--MindIR


相比常规的开发先要装一堆的环境和软件,基于 ModelArts 的 AI 开发似乎变得更简单,理论上有能上网的设备就够了,比如 pad,然后仅仅需要注册一个华为云账号并实名认证。当然,ModelArts 准备工作并不仅仅是这些,比如如需用到 OBS 还需生成访问密钥并完成 ModelArts 全局配置。具体操作请参考 ModelArts-Lab:https://gitee.com/ModelArts/M...


Free 的「我的笔记本」就在 ModelArts 总览页底部的开发工具卡片中,点击「立即体验」即可开启一个默认的 CPU 环境的 JupyterLab,我们可以在右边的「切换规格」栏进行环境或者规格的切换。需要注意的是:


切换资源后,将影响实例下所有 Notebook 与 Terminal。Notebook 中执行的所有变量将失效,Terminal 需要重新打开,手动安装包不再生效,需要重新执行。


目前, CPU 和 GPU 环境支持 Conda-python3 、Pytorch-1.0.0、TensorFlow-1.13.1 等 8 种 Notebook 环境,不过使用 GPU 需要注意:


1、免费规格用于使用体验,会在 1 小时后自动停止;


2、免费算力不包含对象存储服务(OBS)存储资源费用。


如果想使用 MindSpore 框架,可以从 MindSpore 官方文档教程中的 「Run in ModelArts」进行跳转到带有 MindSpore 框架的 JupyterLab。


image


二、Seq2Seq 简介


Seq2Seq是 Google 在 2017 年开源的一款用于 TensorFlow 的通用编码器 &解码器框架(encoder-decoder framework),可用于机器翻译、文本摘要、会话建模、图像描述等。


image


论文地址: https://arxiv.org/abs/1703.03906


三、Copy 实践


新建 TensorFlow 1.13.1 环境的 notebook 文件,开始代码编(kao)写(bei)。


image


  • 数据集下载


couplet-dataset 尽管比较陈旧,但拥有 70 万条数据,应该够实现一个简单的对对联模型。


image


  • 依赖安装及引用


image


image


image


  • 数据处理


image


image


  • 模型定义


image


其他代码此处就不再贴了,建议直接参考源码出处,或者访问https://github.com/hu-qi/modelarts-couplet。此处我选择 200 个 Epoch,训练过程如下图:


image


从图中明显可以看出评估函数输出的下联不断地在调整。当训练完成之后我们便炼的了简单能使用的丹--AI 对对联模型,紧接着测试一下:


image


image


不错不错,还是挺工整通顺的!


当然实践中也并不是一帆风顺,训练过程中如果遇到续期提示,请务必要手动点击,不然又得重启 Notebook 。续期就对了,尽管我不太清除能续几次,但续期就不会导致训练中断。


image


四、总结


此次实践的数据集和 notebook 已上传到 github :https://github.com/hu-qi/modelarts-couplet, 另外对联数据也共享到 ModelArts AI Gallery:couplet-dataset:70万对联数据集,欢迎取阅!


点击关注,第一时间了解华为云新鲜技术~


发布于: 2021 年 02 月 01 日阅读数: 34
用户头像

提供全面深入的云计算技术干货 2020.07.14 加入

华为云开发者社区,提供全面深入的云计算前景分析、丰富的技术干货、程序样例,分享华为云前沿资讯动态,方便开发者快速成长与发展,欢迎提问、互动,多方位了解云计算! 传送门:https://bbs.huaweicloud.com/

评论

发布
暂无评论
智能对联模型太难完成?华为云ModelArts助你实现!手把手教学