写点什么

文本数据标注已上线,支持文本分类、实体识别|ModelWhale 版本更新

作者:ModelWhale
  • 2023-02-10
    上海
  • 本文字数:1171 字

    阅读完需:约 4 分钟

文本数据标注已上线,支持文本分类、实体识别|ModelWhale 版本更新

元宵已过,年味犹存,时间流逝,步履不停。兔年第一次版本更新,ModelWhale 期待为你带来更好的使用体验。


本次更新中,ModelWhale 主要进行了以下功能迭代:


  • 新增 文本数据标注(专业版✓ 团队版✓ )

  • 新增 Canvas 自定义组件版本隐藏(团队版✓)

  • 新增 Canvas 组件导出为 Python 脚本(专业版✓ 团队版✓ )

  • 新增 自定义算力使用时长限制(基础版✓ 专业版✓ 团队版✓ )


1、新增 文本数据标注(专业版✓ 团队版✓ )

经标注处理的结构化数据可以更好地被算法模型训练使用。ModelWhale 数据标注工具除支持语义分割、图形识别、分类的图像数据处理工作外,现已支持文本分类、实体识别的文本数据处理(平台会自动进行语料切分)。标注任务支持由多人分工标注、审核, 同时支持自定义标注用快捷键,提高标注效率。审核通过的数据可以 “导出为数据集” 作为后续模型训练语料使用,更多详见标注工具使用手册






2、新增 Canvas 自定义组件版本隐藏(团队版✓)

算法工程师可以利用 Canvas 将算法封装成 Canvas 组件,供他人零代码拖拉拽使用。组件的更新调整(包括代码、参数、输入/输出)可以通过“组件版本”进行记录和追溯,也可以通过开启“更新提示(New)”提醒组织内成员关注。如果组件的一些历史版本,你不希望成员们查看/使用(e.g. 组件存在缺陷),现已支持将其“隐藏”实现组件弃用,更多详见 Canvas 使用手册

Tips:拖拽组件进行零代码建模时,平台默认选用最新组件版本;若组件进行了版本迭代,为避免原有工作流不可用,成员可以选中组件后点击「使用新版」进行手动更新。





3、新增 Canvas 组件导出为 Python 脚本(专业版✓ 团队版✓ )

ModelWhale Canvas 提供丰富的数据分析、机器学习算法组件,供你拖拽搭建可视化的分析流程。完成搭建后,你可以将该“工作流”保存为“Flow”以便后续复用,也可以将它“导出为 Python 脚本”实现进一步的灵活应用。

Tips:Canvas 还支持导出为 Notebook,导出时支持排序、展示/隐藏代码、展示/隐藏输出等自定义操作。






4、新增 自定义算力使用时长限制(基础版✓ 专业版✓ 团队版✓ )

ModelWhale 提供性能稳定、多规格的 CPU、GPU 算力,无需配置繁琐信息,联网即用。为避免算力空转造成损失,平台设有安全机制:(1)单次使用时长(默认 8 小时),达到该时长且无操作时,算力自动回收;(2)闲置时长(默认 10 分钟),达到该时长时,平台会自动回收算力(若你仅关闭了编程界面、未关闭实例)。这些时长限制现已支持用户自行调整;团队管理员也可以统一团队内的安全阈值(不允许成员调整)。






以上就是本期 ModelWhale 版本更新的全部内容。

进入 ModelWhale.com,免费试用专业版(个人研究)或试用团队版(组织协同),获赠 CPU 和 GPU 算力!(建议使用电脑端进行试用体验)

如果对 ModelWhale 有任何建议、疑问,或有试用续期需求,欢迎【联系MW】,MoMo 很高兴为你服务、与你交流。

发布于: 刚刚阅读数: 3
用户头像

ModelWhale

关注

个人数据分析工具,组织数据科学协同平台 2022-07-29 加入

ModelWhale 将数据管理、建模分析、模型训练管理、算力资源管理等功能深度整合,通过逐级开放的数据基础设施、 Jupyter Notebook 和 Canvas 两种分析界面、即开即用的云端分析环境,使数据驱动的研究更便捷高效。

评论

发布
暂无评论
文本数据标注已上线,支持文本分类、实体识别|ModelWhale 版本更新_人工智能_ModelWhale_InfoQ写作社区