华为云 ModelArts 文本分类–外卖评论
1、数据简介
本数据集为外卖评论数据集,包含约 4000 条正向评论、8000 条负向评论。数据集文本对象和标注分别存放在如下不同文件中:
comment.txt
comment_result.txt
2、适用的算法
本数据集可用于如下 AI Gallery 中文文本分类算法进行训练中文文本分类-Bert:AI Gallery_算法_模型_云市场-华为云
基于 BERT 预训练模型的文本分类算法,支持单标签文本分类。预训练模型基于Google发布的BERT BASE模型。用户需要在数据管理平台完成标注,该算法会载入预训练模型在用户数据集上做迁移学习。训练后生成的模型可直接在 ModelArts 平台部署成在线服务,同时支持使用 CPU、GPU、Ascend310 推理。Ascend310 推理需要配置 export_d_model 参数为 True。
3、使用方法
a、下载本数据集至您的 OBS 桶中
b、在 ModelArts“数据管理-数据集”创建文本分类数据集(注意:数据集输入位置、数据集输出位置选择 2 个空的 OBS 路径)
c、在数据集详细页面右上角“导入”,导入方式选择“对象存储服务(OBS)目录”,目录位置选择上述下载路径,模式选择“文本和标注分离”
d、待导入完成后,会显示 11987 条数据已标注,单击页面右上角“发布”,数据按照 0.8:0.2 比例切分
e、订阅文本分类算法,选择上述发布的文本分类数据集进行训练
4. 详细图解
AI Gallery 入口
AI Gallery-开发者-华为云 (huaweicloud.com)
下载完成如下图
下载完成后进入控制台
ModelArts-管理控制台 (huaweicloud.com)
接着进入自主学习
选择刚才创建好的数据集
模型训练
部署上线
预测结果
版权声明: 本文为 InfoQ 作者【逝缘~】的原创文章。
原文链接:【http://xie.infoq.cn/article/5238425916857586d51a8821f】。未经作者许可,禁止转载。
评论