一种很新的交互式智能标注技术

2023-06-20
上海
本文字数：1185 字
阅读完需：约 4 分钟

随着人工智能应用的大规模落地，数据标注市场在高速增长的同时，也面临着标注成本的挑战。据 IDC 报告显示：数据标注在 AI 应用开发过程中所耗费的时间占到了 25%，部分医学类应用一条数据的标注成本甚至高达 20 元。数据精度的高要求、强人工的依赖、复杂的工具使用逻辑等都是造成标注成本高的核心痛点。

例如，计算机视觉领域的一个重要技术——图像语义分割，可以将图片切割成具有不同语义的色块，从而帮助机器理解整个视觉世界。在自动驾驶领域，车载摄像头采集的图像经过图像分割算法处理后，可以帮助汽车实现避障、寻找可行驶区域等功能。图像语义分割技术对训练数据要求较高，分割准确度通常需达到像素级别，在现实世界中不规则物体边缘的标注效率会更低。

▲ MatrixGo 全景语义分割示意图

澳鹏 Appen 中国自主研发的人工智能辅助数据标注平台 MatrixGo——交互式智能标注，就是针对相关痛点研发落地的重点方向。澳鹏 Appen 团队希望通过 AI 赋能，为用户创造更高质量的数据价值。

标注平台的智能化水平

Intelligence Level of Platform

我们将数据标注平台根据智能化及自动化水平，分为 L0 到 L4 的 5 个阶段。其中，L2（即智能交互）考虑到了“人”在数据标注环节中的交互作用。通过更好的算法介入和交互逻辑引导，使用户能够通过简易操作完成高效标注。

▲ L0 到 L4 的 5 个智能化阶段

标注人员首先找到期望标注的对象，输入中心点后，模型给出首次识别的效果；对于识别不够精准的部分，标注人员只需通过点击响应的形式，来告知模型预测的不正确区域，即可得到更正后的识别结果，而无需依赖手动画线。

智能交互过程

Process of Intelligent Interaction

通过快速点选需要标注的前景对象，模型会预测出主体轮廓部分；当遇到标注有误需要修改的地方时，通过点选背景位置的反馈，工具会自动进行智能化收边和擦除操作。在模型识别过程中，标注人员通过简单的交互输入，得到更精准的识别效果。依靠简单点选取代稠密的轮廓绘制过程，根据项目实际应用统计，相对纯人工标注可节省约 50%的标注时间。

▲ 交互流程示意

通过设计用户交互理解模块，输入用户的一系列交互行为，输出对应的高层特征，来建模用户输入的行为模式，可以有效推断出质量更好的标注结果。同时，辅助使用点击行为采样，根据用户的历史标注行为埋点，来提取有效的数据进行学习。输出上，考虑到不同项目和业务要求，支持一般的矩形框、多边形以及像素图等不同格式输出。