写点什么

计算机视觉常用图像数据集标记平台

发布于: 2021 年 06 月 01 日
计算机视觉常用图像数据集标记平台

在计算机视觉中海量图片数据的标记是个让人头疼的问题,通过学习总结列举以下几种常用的图像标记平台,从平台的价格、各种功能、工具和格式、项目管理和易用性等方面分析各个平台的特点,希望对小伙伴们有所帮助。

1、LabelIMG

LabelImg 是一个开源图像标记工具,它为 Windows 预先构建了二进制文件,因此它非常易于安装。

价格:免费

功能:仅支持边界框(还有一个 RotatedRect 格式的版本和一个类标记的优化版本),但没有更高级的功能。格式为 PascalVoc XML,并且为源文件夹中的每个图像单独保存注释文件。

项目管理:它没有项目管理属性,但它确实允许一种简单的方法来导入和可视化注释并在必要时进行更正。简单的离线界面使得注释过程非常快,即使它不支持许多热键快捷方式。

GitHub 网址:https://github.com/tzutalin/labelImg

2、VGG Image Annotator

VGG 是一个开源工具,就像 LabelImg 一样,它可以很好地完成不需要项目管理的简单任务。它可以作为在线接口使用,也可以作为 HTML 文件离线使用。

价格:免费

功能:提供了更多的工具,包括点、线、多边形、圆和椭圆(仅在此列表中支持圆和椭圆!)还可以添加对象和图像属性/标签。注释可以作为一个包含所有注释的 JSON 文件下载,也可以作为一个 CSV 文件下载,如果需要查看注释,还可以在之后上传。

项目管理:在数据集管理和用户方面没有什么先进的功能,但是它的界面是多边形注释最有效和最精确的界面之一,因为它允许您查看多边形的线条而不是其他任何内容。它们支持一些热键快捷方式,一般来说应用程序非常轻量级。

网址:http://www.robots.ox.ac.uk/~vgg/software/via/

3、Supervise.ly

Supervis.ly 是一个非常棒的基于 web 的平台,它提供了一个高级的注释接口,同时还提供了一个自托管的基础设施,用于模型培训和改进。

价格:模型培训版的免费社区版和企业定价

功能性:一系列工具,包括点,线,盒,多边形和用于语义分割的位图画笔(我们还没有发现它们的智能工具太有用了)。还包括在多边形中绘制孔的可能性,这是非常有价值的。另一个非常有用的功能是添加图像和对象标签以及在图层中排序图形的选项。每个图像或 PNG 蒙版的输出都在 JSON 文件中,平台还允许您上传 Cityscapes 和 COCO 等格式。此外,还可以选择直接在平台上进行数据转换。

项目管理:该平台为数据集管理提供了大量选项,包括为用户添加细化权限,监控性能统计,标记对象等。缺少的一些事情是时间统计和质量控制机制。他们的技术支持团队随时可以解决问题。该界面允许非常精确的工作并支持可定制的热键快捷方式,但最近性能有时很慢,如果平台需要花费大量时间在图像之间切换和记录注释,这可能会非常令人沮丧。

网址:https://supervise.ly/

4、Labelbox

Labelbox 是另一个伟大的基于网络的平台,于 2018 年初推出,从那时起不断更新和改进其功能。它还提供了通过导入模型预测并查看贴标机和模型之间的共识来集成人在环的可能性。

定价:免费社区版仅限 5000 张图片和企业版

功能性:提供完整的注释工具,如点,线,盒和多边形,最近为他们的语义分割画笔添加了一个很棒的新功能 – 一个超级像素着色选项,使生活变得如此简单(就像这样和这个开源工具)。输出是一个包含所有注释或 PNG 掩码的 JSON 或 CSV 文件(但是,每个类都有一个掩码,用户需要弄清楚如何处理重叠区域)

项目管理:设置项目非常简单,监控性能有很多选项,包括标记图像所需的秒数统计,以及激活不同贴标机之间的自动共识。您可以选择邀请用户(虽然权限不是那么精细)并查看每个用户的工作。标签界面非常人性化,并支持热键快捷键(虽然不可自定义)。免费版中缺少的一件事是上传注释以便可视化或编辑它们的选项。

网址:https://labelbox.com/

5、其他平台

Diffgram :一个非常有前途的平台仍然在 beta 版,通过训练 RCNN 优化图像注释。

RectLabel :用于为 MacOS 绑定框和多边形的绝佳工具。

Prodigy:它们提供了一个自托管的后端,具有不同的注释接口,包括带有边框的图像注释;他们的产品定价从 390 美元起,供个人使用(每位用户终身使用)。

DataTurks:提供许多注释功能的平台,免费版本中注释的数据是公开的,小型团队的企业定价从每月 300 美元开始。

ImageTagger :一个用于协作图像标签的开源平台。

Fast Annotation Tool  :另一个开源工具,使用 OpenCV 用于 RotatedRect 格式的边界框。

LabelMe :麻省理工学院用于多边形注释的行业经典开源工具,但精度非常低。

PolygonRNN++: 仅作为演示版提供,但仍然非常有前景;在 Cityscapes 数据集上训练的工具确实为自动驾驶汽车生成自动标签,并加强学习。

发布于: 2021 年 06 月 01 日阅读数: 24
用户头像

【研究方向】物联网、嵌入式、AI、Python 2018.02.09 加入

【公众号】美男子玩编程

评论

发布
暂无评论
计算机视觉常用图像数据集标记平台