“人类高质量数据”如何训练计算机视觉模型?
人类的视觉系统可以复制吗?
答案是肯定的。
计算机视觉 (Computer Vision) 技术的不断普及,让机器识别和处理图像就像人的大脑一样,且速度更快、更准确。
机器·像人类一样去“思考”
Computer Vision Applications in Use
计算机视觉 (Computer Vision) 是近年来人工智能增长最快的领域之一。许多计算机视觉应用已经投入使用,且正在以更快的速度、更大的规模去尝试模仿人类观察和理解周围世界的能力。
在自动驾驶领域,计算机视觉的图像识别功能使汽车能够识别行人、道路标志及行进路线中的其他重要特征;在医疗领域,医生利用计算机视觉技术支持来自 CT、放射线图像和其他成像工具的诊断;在电子商务领域,企业依靠计算机视觉推动广告投放和识别不安全的品牌内容...
不可否认的是,各行各业的企业都将受益于计算机视觉解决方案,助力其准确高效地实现业务流程自动化。而用于计算机视觉的深度学习基于神经网络,它需要大量的高质量训练数据并适当调整变量,以达到让机器学会识别目标对象、而无需其他指导的目的。
部署·人类高质量训练数据
Best-in-Class Training Data for CV Models
澳鹏 Appen 提供完整、干净且正确标注的高质量训练数据, 赋能最具创新性的机器学习和业务解决方案,帮助识别和处理图像和视频中的对象,并将数据用于构建无人驾驶、机器人、地图和卫星、农业等领域的智能系统。
澳鹏 Appen 标注工具均具有智能标注功能。通过机器学习模型进行自动标注,达到辅助标注员更快速准确交付的效果:
预标注:项目启动前,使用澳鹏 Appen 模型库提供的初始“最佳猜测”假设。
快速标注:项目进行中,利用机器学习模型进行快速准确的标注。
智能验证器:在标注员提交任务前,使用机器学习模型对人工判断进行验证。
与澳鹏 Appen 的合作令我们的模型开发进度提高了 10 倍,我们得以快速进行下一步部署并考虑扩大规模。
——GumGum 产品经理 Lane Schechter
视频标注
借助机器学习的快速标注构建训练数据集,比仅依靠人力标注快 100 倍,并可用于所有边界框任务。
图像标注
通过更精简和高效的图像标注提高质量并缩短标注时间。
预标注
将人工标注和机器学习相结合,以低成本高效益提供高质量的训练数据。可从多种模型的目录中选择。
图像转录
利用 OCR 辅助功能进行快速标注,更快速、更准确地实现 31 种语言的转录。
像素级语义分割(PLSS)
使用 PLSS 进行精确到像素级的高精确度标注,与之前的 PLSS 工具相比,标注速度提高了 25%。
点云标注
使用插值、一键式长方体自动调整、机器学习生成分类归并和预标注,加强对象追踪,实现快速数据标注。
案例·现实中的数据解决方案
Improved Data Efficiency With Clients
澳鹏 Appen 依靠自己的数据专家团队,助力各行各业的领军企业构建先进的计算机视觉模型。20 多年来,许多成功的合作案例由此展开。
机器学习实际应用的一大挑战是缩短从构思到生产的周期。如果能够快速调整训练数据并将机器学习团队的反馈整合到流程中,迭代周期将显著加快。与澳鹏 Appen 的合作让我们可以在短时间内使模型进入到生产阶段。
——Shotzr 联合创始人 Mark Lemmons
为了建立模型以提高客户的搜索相关性, Adobe 需要高精度的训练数据创建模型,这种模型可以在其库存超过一亿张、 每天上传数十万张新图片的图库中显示这些微妙的属性。结合人机协同和我们的智能标注功能,为 Adobe 大量的客户群提供最有价值的图像。
HERE Technologies 与澳鹏 Appen 合作,利用视频、图像和文本创建最精确的地图。通过视频标注工具,HERE 能够微调街道标识检测算法,并使用各种标识的边界框训练 OCR 算法。利用智能标注功能,HERE 为研发人员创建可执行的数据,使其能够在更短的时间内微调地图。
Shotzr 使用澳鹏 Appen 平台为客户改善推荐和搜索体验。Shotzr 借助机器学习能够快速自动识别哪些图像需要具有特定位置的元数据。在澳鹏 Appen 平台上完成第一项工作后,Shotzr 识别出超过 1.7 万张无需附加标注的图像。鉴于位置数据考虑,目前有预计超过 6,100 万图片可删除。
计算机视觉在各行各业中的广泛用途令其迅速在我们的生活中普及开来。未来,计算机能够以更快、更高效的速度处理通常由人类完成的常规任务。随着数据可用性和计算机处理能力的不断提高,这一领域无疑值得持续关注。
APPEN
澳鹏 Appen 提供数据标注和采集服务,以大规模优化计算机视觉模型并提升机器学习效率。作为该领域的全球领导者,我们能够快速交付海量高质量的图像和视频数据,以满足企业特定的计算机视觉应用场景需求。
关注我们,由数据开始构建您的计算机视觉战略。
版权声明: 本文为 InfoQ 作者【澳鹏Appen】的原创文章。
原文链接:【http://xie.infoq.cn/article/acab6bb4fe67903e4434e01fa】。文章转载请联系作者。
评论