写点什么

智源发布具身数据创新基座,携手行业共筑物理 AGI 基础设施

作者:智源研究院
  • 2025-11-25
    北京
  • 本文字数:1907 字

    阅读完需:约 6 分钟

智源发布具身数据创新基座,携手行业共筑物理AGI基础设施

2025 年 11 月 20 日,北京智源人工智能研究院正式发布具身数据创新基座:智源具身一站式平台 RoboXstudio、大型高质量双臂机器人真机数据集 RoboCOIN、智源具身数据软件框架 CoRobot,推动了具身数据生产效率和质量的全面升级。


1 具身智能三大数据难题


具身数据是当前具身智能发展中最热门的话题,然而,它仍面临着数据孤岛、质控缺失、成本难题三大挑战。


  • 数据孤岛:具身数据格式不统一、标准缺失,导致数据处理过程复杂。同时,具身智能数据工具链分散,导致数据使用壁垒高。现状是数据相互隔离。形成“数据孤岛”。

  • 质控缺失:具身数据仍普遍存在丢帧、卡顿、静止帧、关节信息不齐、时间戳错位等记录问题。同时,还可能存在数采动作过快过慢等操作问题,缺乏质量控制措施。

  • 成本难题:具身数据生成过程依赖大量人工操作与标注,效率低。缺乏成熟平台来支撑难以规模化,设备、场地和人力综合导致数据生产成本居高不下。



2 CoRobot 具身数据软件框架


为了解决上述问题,智源研究院构建了一套“面向异构本体、规范操作流程、提升研发效率”的具身数据软件框架 CoRobot。借此实现了“定标准、保质量、提效率”的三大目标。


该软件框架由 5 大组件构成:

  • 泛本体数采工具——支持接入各种本体和遥操作设备。

  • 格式转换工具——支持其他格式与标准格式的双向转换。

  • 数据处理工具——可处理丢帧、卡顿、关节信息不齐、时间戳错位等记录问题,标注场景、任务、运动描述信息。

  • 数据管理工具——支持具身数据的原子化存储、可视化,数据的多维度、精准筛选,目标数据集的下载命令生成。

  • 模型训推工具——支持π0、RDT、ACT、DP 等具身模型训练任务的快速接入,支持参数调节与训练进度管理。


CoRobot 具身数据软件框架主页:

https://github.com/FlagOpen/CoRobot



3 共建 RoboCOIN 数据集:全球双臂机器人数据新标杆


基于 CoRobot 具身数据软件框架,智源研究院联合蚂蚁天玑实验室、银河通用、乐聚、软通天擎、松灵、星海图、智平方、睿尔曼等 8 家企业,以及清华大学、北京大学、中国人民大学、北京邮电大学、电子科技大学、斯坦福、伯克利和剑桥大学等高校,合作建立了一个全球“本体数最多、标注最精细、使用最便捷”的高质量双臂机器人真机数据集 RoboCOIN。


RoboCOIN 数据集具备三大领先优势:


  • 本体数最多:该数据集涉及的双臂本体数远超之前开源的数据集,包括了 15 款双臂机器人,数据量达到 18 万条,覆盖工业、家居、零售等 10 多个场景。

  • 标注最精细:借助 CoRobot 软件框架,对数据集完成了“轨迹级-段级-帧级”的三层次细粒度标注,使之成为全球标注最细的数据集。

  • 使用最便捷:依托 CoRobot 软件框架实现开箱即用,使之成为全球使用最便捷的数据集。


RoboCOIN 数据集主页:

https://flagopen.github.io/RoboCOIN/



4 发布 RoboXstudio 平台:一站式赋能具身智能研发


为全面提高具身智能研发效率,加速“数据 &模型”的循环迭代,智源研究院基于 CoRobot 具身数据开源框架、FlagOS-Robo 具身训推一体化多芯片框架、Emu3.5 原生多模态世界大模型,打造了具身智能一站式平台 RoboXstudio,能够覆盖数据采集-数据标注-数据管理-模型训练-模型评测-模型部署全流程。


  • 更全面:支持多类型机器人及人体的数据采集,覆盖全场景与多样化任务,实现采集范围无死角。

  • 更系统:构建数采前标准化配置、数采中实时监控、数采后全流程管理的闭环体系,保障采集高效有序。

  • 更智能:集成具身数据开源框架与多模态世界大模型,内置智能算子并实现任务智能拆解、数据扩增,降低使用门槛与人工成本。


智源具身智能一站式平台 RoboXstudio 体验申请:

https://ei2data.baai.ac.cn/home



5 开源开放,共建生态


个体的力量始终是有限的,人工智能的真正进步得益于众多机构的协同创新。智源始终坚持开源开放,截至 2025 年 8 月,智源 FlagOpen 体系的开源模型全球总下载量达 6.9 亿次,在全球 AI 开源领域占据重要的引领地位。


本次智源具身 OpenDay 上,智源具身智能一站式平台(社区版)正式发布,个人开发者、科研机构、高校实验室、具身企业等均可申请免费使用。具身数据软件框架 CoRobot 和具身数据集 RoboCOIN 也面向全社会开源。我们希望以 RoboCOIN 为起点,无保留地分享高质量数据、工具链及方法论,推动行业在统一的标准与规范下协同创新。



智源研究院具身数据负责人姚国才表示,该数据集之所以取名为 RoboCOIN,是寓意每一份高质量数据都如同一枚闪闪发光的“金币”,然而一枚金币的面值是微小的,需要大家都往“存钱罐”里投入更多“金币”,若全行业能够齐心协力,就有希望积少成多,换取到一张通向物理 AGI 的船票。


让我们以开源生态为基础,聚产业创新之活力,促具身智能之落地,共筑具身数据新生态。


RoboCOIN 数据集+工具链+技术报告现已全面开源。欢迎扫码进群,探讨技术细节,洽谈合作。



用户头像

还未添加个人签名 2024-05-11 加入

北京智源人工智能研究院聚焦人工智能原始创新和核心技术,推动人工智能理论、方法、工具、系统和应用取得变革性、颠覆性突破,支撑北京建设成为全球人工智能学术思想、基础理论、顶尖人才、企业创新和发展政策的源头

评论

发布
暂无评论
智源发布具身数据创新基座,携手行业共筑物理AGI基础设施_智源研究院_InfoQ写作社区