2D 智能化标注,MatrixGo 平台的宝藏功能
随着人工智能应用的大规模落地,数据标注市场在高速增长的同时,也面临着标注成本的挑战。据 IDC 报告显示:数据标注在 AI 应用开发过程中所耗费的时间占到了 25%。数据精度的高要求、强人工的依赖、复杂的工具使用逻辑等都是造成标注成本高的核心痛点。
AI 应用落地对于数据大规模标注的需求已经让行业从纯人工标注阶段基本转型为数据预标注阶段。适用于大部分基础标注场景的数据预标注依赖模型对数据的前处理,在不影响标注阶段的情况下,模型效果将直接影响后期的人工工作量。
数据预标注的进一步发展是辅助自动化标注。澳鹏 Appen 中国自主研发的人工智能辅助数据标注平台 MatrixGo——2D 智能化标注的研发应用已进入辅助自动化标注阶段,即:基于人工修正后的模型识别结果重新学习,依靠模型的自动化水平和少量人力判断达到规模化生产。
澳鹏 MatrixGo 平台 2D 智能化标注在提升标注效率的同时极大降低了人力成本。澳鹏团队希望通过 AI 赋能,为用户创造更高质量的数据价值。本期工具看点,一起走近澳鹏 MatrixGo 平台 2D 智能化标注的三大宝藏功能。
视频连续帧自动分割
Auto-Segmentation for Video Annotation
在实际项目中,视频标注的主要难点包括:
▲ 视频连续帧帧数较多,基于单帧标注的传统分割标注方式使得整个标注时长成倍增加;
▲ 即便能够依赖模型进行辅助分割,依旧需要逐帧修正。
澳鹏 MatrixGo 平台产品研发团队发现:由于视频连续帧数据的连贯性较好,前后帧之间的相似度较高,可在已人为修正的分割结果基础之上自动识别标注后续帧,同时自动关联前后帧实例。
通过应用视频连续帧自动分割功能,澳鹏团队根据项目实际应用结果统计,与视频单帧标注相比,该功能可为项目节约 80%以上的标注时间。
批量目标识别
Multiple Object Detection
目标识别一般在数据预标注阶段进行,但预标注的过程存在一定的定制开发及滞后性,可能无法快速投入大批量生产。
澳鹏 MatrixGo 平台 2D 工具箱已集成批量识别功能——仅需框出所需识别范围,即可自动识别该范围内的所有目标物。
此功能开箱即用,无需任何数据预处理及特殊配置,即可在所有 2D 标注中进行大规模应用,并可针对不同场景自主选择工具配置。
在多分类目标识别场景下,预标注可能会将相似分类混淆并需要人工辨别修改;MatrixGo 平台上的批量目标识别功能可选择分类及特定识别区域,更加方便灵活。
交互式分割
Interactive Segmentation
全自动的 2D 分割往往无法完全正确识别所有目标的边界。这就意味着,带有预标注的分割类项目后期的调整成本相对较高。这时需要辅以一定的人工判断,在利用模型能力的同时,减少人工调整的成本,快速提高标注效率。
目前,澳鹏 MatrixGo 平台 2D 工具箱交互式分割功能已在两种图形上实现支持:
多边形:使用鼠标左键/右键,添加识别的控制点,以获得最终分割效果并完成创建。
色块:支持点击识别和拉框识别,且具备智能添加和智能擦除功能,使得该功能在图形创建和修改阶段都可以用来提升标注效率。
MatrixGo 平台 2D 工具箱的交互式分割功能在不同类型的项目实践中,可为实际项目总体提升约 30%-50%的标注效率。
澳鹏 MatrixGo 平台 2D 智能化标注结合算法识别+人工判断,极大程度上提升标注效率和准确率。我们始终致力于通过 AI 赋能数据采标的全生命周期,提升数据生产效率,充分给予 AI 应用开发以数据养料,从而为更多场景 AI 应用的大规模落地提供有力支持。
版权声明: 本文为 InfoQ 作者【澳鹏Appen】的原创文章。
原文链接:【http://xie.infoq.cn/article/125af9f190c6a6af3e6c59f43】。文章转载请联系作者。
评论