写点什么

亚马逊机器人如何用多模态识别技术取代条形码

作者:qife
  • 2025-07-29
    福建
  • 本文字数:1073 字

    阅读完需:约 4 分钟

亚马逊机器人如何用新技术消除条形码需求

条形码已使用近 50 年,虽然无处不在且几乎不会出错,但对亚马逊来说还不够完美。在亚马逊运营中心,员工需要在商品流转至送货车的多个节点扫描条形码验证身份,这个过程需要人工定位和扫描,且可能遇到条码损坏或缺失的情况。


面对数百万种不同形状尺寸的商品,这种流程难以自动化。目前还没有机器人能灵活处理仓库中所有商品并完成扫描。亚马逊的解决方案是:用多模态识别技术(MMID)增强或取代条形码,彻底摆脱低效的人工识别。

多模态识别技术原理

MMID 通过多种信息模态实现自动识别,例如从商品图像中提取外观和尺寸特征。该技术已在汉堡和巴塞罗那运营中心的传送带上投入使用,用于检测"虚拟-物理不匹配"情况(托盘商品与库存系统记录不符)。


"我们的终极目标是将其应用于机器人操作,"亚马逊柏林计算机视觉团队应用科学经理 Nontas Antonakos 表示,"让机器人无需寻找和扫描条形码就能处理商品,这对提升包裹投递速度和准确性至关重要。"

技术开发过程

研发团队首先需要教算法将商品与其照片匹配。由于缺乏商品在运营中心的图像数据,第一步是在传送带上方安装摄像头建立图像库。每张图像被转换为数字向量(特征描述),商品尺寸同样被向量化。通过深度学习算法,初期实验就达到 75%-80%的匹配率。


经过持续优化,当前 MMID 匹配准确率已接近 99%。关键突破在于:算法只需在单个料箱的几十种商品中进行匹配,而非亚马逊数亿商品的全量库。

实际应用场景

该技术首先在波兰什切青运营中心试点,摄像头安装在单条传送带上方,专门拍摄"单一商品托盘"(每个托盘仅含一件商品)。这种设计简化了识别难度,并能在流程早期发现错误。


"我们可以直接将错误商品回收至正确位置,"参与该项目的机器人 AI 应用科学家 Doug Morrison 解释。MMID 传感器平台的优势在于非侵入性:仅在不匹配时触发处理流程,正常情况不影响产线运行。

技术挑战与改进

系统曾因 Prime Day 促销遇到特殊挑战:每小时数百个外观几乎相同的灰色/蓝色 Echo Dot 导致算法混淆。这促使团队开发了"置信度评分"功能:


  • 高分表示潜在不匹配(阻止托盘通过)

  • 低分表示不确定(不采取行动)

未来发展方向

虽然传送带环境的光照和物品速度相对可控,但将 MMID 整合到人工拣货环节仍面临挑战:员工手持方式会影响检测,物品在双手间传递时需要更快识别速度。机器人研究人员正在攻克这些难题。


Antonakos 表示:"将 MMID 应用于整个履约流程以实现机器人自动化的愿景必将实现,这将是我们更快速精准投递包裹道路上的重要里程碑。"


技术领域:机器人技术/计算机视觉/运筹优化更多精彩内容 请关注我的个人公众号 公众号(办公 AI 智能小助手)公众号二维码


办公AI智能小助手


用户头像

qife

关注

还未添加个人签名 2021-05-19 加入

还未添加个人简介

评论

发布
暂无评论
亚马逊机器人如何用多模态识别技术取代条形码_机器人技术_qife_InfoQ写作社区