澳鹏 Appen 田小鹏博士:以高质量数据赋能 AI 驱动的元宇宙时代
“元宇宙”正在逐步走进现实。根据摩根士丹利的研究预测,中国元宇宙潜在市场规模达 52 万亿人民币。
我们现在通常所讨论的“元宇宙”,强调虚拟和现实之间的结合,需要不断整合各种新技术。沉浸感是元宇宙与现实融合的基础。想要真正构建元宇宙,“沉浸感”至关重要。高盛公司报告称,到 2025 年,AR/VR 行业值将达到 950 亿美元。
澳鹏 Appen 全球副总裁、大中华及北亚区总经理田小鹏博士表示:“作为元宇宙六大支撑技术之一的交互技术是人机连接的关键技术。AR/VR 等交互技术的突破是元宇宙时代到来的必由之路。而 AR/VR 与人工智能的结合,将推动全新的用户体验以及人们与世界互动的方式。”
AR/VR 与 AI 之间有着深刻的互补关系。AI 擅长许多有利于 AR/VR 的操作,例如跟踪物体、创建 3D 世界的详细模型、了解这些模型的特征,并对它们做出判断。AI 中的深度学习模型可以帮助 AR/VR 系统解释复杂的环境。
许多行业领导者预测,人工智能将有助于推动沉浸式技术在各行各业的应用。AI 可以使用更逼真的模型,并赋予人们更强的情景互动能力,从而优化 AR/VR 的沉浸式体验,例如:
游戏
创造越来越逼真的游戏体验,并为玩家提供更多与数字环境互动的机会。
零售
当购物者在商店中穿行时,出现数字环境中的弹出式优惠券;虚拟试衣间,让顾客在家中舒适地试穿衣服等。
科技
智能眼镜未来可能会成为所有人的标配。如果我们遇到一位同事,智能眼镜可以识别出他在公司担任什么职位。
通讯
在虚拟会议中,AI 可以添加摄像头跟踪功能,使大家的注意力集中在正在说话的人身上,远程开会也感觉近在眼前。
安全
安全部门可以利用 AI 驱动的 VR 来进行身份检测和标记可疑人物的图像,等等。
AI 生命周期的四大阶段包括:数据获取、数据准备、模型训练和部署、人工模型评估。其中,数据获取、数据准备和人工模型评估往往充满挑战。田博士表示:“海量的数据需求使得 AI 从业者将 80%以上的时间都花在数据管理上。生成 AI 驱动的 AR/VR 系统需要大量数据。因此,数据采集和标注成为构建这类技术过程中的关键步骤。”
在 AI 驱动的 AR/VR 项目的部署中,数据通过传感器、产品图片、社交网络等途径采集,并根据不同的应用场景对关键特性进行标注以便模型识别。常见的数据标注类型包括:
图像和视频
-目标检测:模型学习识别图像中的物体及其位置,以触发使用户能够与环境交互的命中框和碰撞体;
-分类:模型学习分类图像中的目标对象,然后触发显示该图像的标注;
-分割:通常在像素层面进行,模型学习分割图像中的目标对象。
音频
-音频识别:模型处理音频,如语音等,并作出相应的解释。某些关键词可能会触发 AR/VR 效果,比如在游戏环境中。
文本
-文本识别与翻译: 模型学习检测和读取图像中的文本,然后将其翻译成适当的语言。AR 技术可以将译后文本覆盖到现实世界中。
在 AI 驱动的 AR/VR 技术应用中,采集的数据量越多,环境就可能越真实。更高质量的数据可以产生更高质量甚至足够个性化的环境。澳鹏 Appen 提供高质量的图像、文本、语音、音频、视频数据采集和标注服务,帮助企业构建并持续完善全球最具创新性的人工智能系统。
此外,AR/VR 数据通常包含用于交互的个人身份信息,包括地理位置数据、生物特征、购买历史和其他 PII 等。在构建这些应用程序时,数据安全至关重要。对此,澳鹏 Appen 始终致力于为客户提供最高级别的管理标准。澳鹏中国已获 ISO 27001, ISO 9001 和 ISO 27701 认证。其自主研发的人工智能辅助数据标注平台 MatrixGo 也具有权限管控、数据加密传输、PII 信息加密存储等严格的数据安全管控策略,最大限度地保证企业数据资产安全。
田博士表示:“元宇宙中描绘的虚拟世界是复杂的,而构建虚拟世界并不是一项简单的任务。越来越多的企业正在寻求专业数据提供商的帮助,以获得在沉浸式领域的竞争优势。与专业的数据提供商合作,通过设置可扩展数据管道,以高质量数据不断训练、改进模型并优化用户体验,为人类在元宇宙空间进一步拓展能力边界赋能。”
未来几年,人工智能有望成为推动 AR/VR 行业向前发展的引擎,而海量、高质量的训练数据则是引擎发展的动力。沉浸式技术持续发展已成必然,而这亦是企业通往元宇宙和人工智能高速赛道的新机遇。
版权声明: 本文为 InfoQ 作者【澳鹏Appen】的原创文章。
原文链接:【http://xie.infoq.cn/article/1067738b925e5f94a5f103211】。文章转载请联系作者。
评论