写点什么

澳鹏中国第三年,缘何成为 AI 训练数据服务行业领头羊?

作者:澳鹏Appen
  • 2023-01-04
    上海
  • 本文字数:5493 字

    阅读完需:约 18 分钟

澳鹏中国第三年,缘何成为AI训练数据服务行业领头羊?

导语

当万物互联时代的数据洪流滚滚而过,当 AI 和元宇宙的精妙算法嗷嗷待哺,人们惊讶地发现“原始数据”和“AI 可用数据”之间存在着惊人的逆差,高质量机器数据的供给深深影响着 AI 的“智商”发育。


有一家企业致力于架起“次数据与彼数据之间的桥梁”,它是 AI 算法的眼和耳,是数据丛林的拓荒者,是喂养 AI 的农夫,更是 AI 数据洪流的“自来水厂”……如今,中国最顶尖的互联网巨头、自动驾驶公司、手机厂商纷纷成为其客户,只用了短短 3 年时间,这家公司就成为中国市场占有率之首。


澳鹏中国三周年,IT 时报记者深度对话澳鹏 Appen 全球高级副总裁、大中华区及北亚区总经理田小鹏博士,畅谈三年来“飞速增长”背后的故事。



原文转载自:IT 时报

作者:王昕


从零到“第一”


澳鹏进入中国市场的步伐与许多全球化企业颇为相似,但却又非常不同。


2019 年,中国的 AI 生态和市场如春风吹过,快马加鞭步入高速增长期,而此时的澳鹏已是全球 AI 数据服务细分领域的行业第一。同年 10 月,顶着行业领导者的光环,澳鹏来到中国,田小鹏回忆,当时的创始团队不足 10 人,正是这批创业者白手起家,开始了澳鹏在中国市场的传奇发展历程。


自 2020 年,受疫情、地缘冲突等多种因素影响,全球经济正面临空前严峻的挑战。根据 2022 年 4 月国际货币基金组织(IMF)发布的报告显示,2022 年和 2023 年全球经济增速将由 2021 年的 6.1%下降至 3.6%,较 1 月发布的预估值分别下降 0.8%和 0.2%。具体到亚洲地区,博鳌亚洲论坛 2022 年年会报告中称,亚洲区域经济增速还有可能低于 IMF 预测值 5.2%,预计为 4.8%。


但是短短 3 年之后,澳鹏中国完成了“从零到‘第一’”的惊人一跃。与成立之初相比,至 2022 年中报发布,澳鹏中国在专注于人工智能数据服务商中营收排名第一。澳鹏中国在 2021 财年营收年实现 421%的爆炸性增长。(数据来源:上市公司财报)。


三年中,澳鹏中国一直在高速成长的赛道上,并成为 AI 数据服务行业的领头羊。在其他同业上市企业的财报中,中国 AI 数据服务的前三甲企业必提澳鹏,且其他本土友商要与澳鹏中国进行全方位对标。如今,中国排名前十位的互联网企业、以及前十位自动驾驶公司中的九家企业都是澳鹏中国的客户。


相较于此前国际巨头在国内频频遇上的水土不服,澳鹏中国却以闪电速度在中国市场崛起。“我们的快速发展让竞争对手都觉得不可思议。”田小鹏说,站在今天回望三年前,“也许我们从第一天开始就注定了与别人不一样,其他人可能会按一套固有的模式运作,因为我们新进入这个市场,所以没有太多的条条框框,澳鹏中国带着这种天生的友好创新基因,开始重塑行业。”


问:进入中国市场短短 3 年,就从零起步夺下行业第一,澳鹏中国到底做对了什么?


田小鹏:澳鹏中国通过这 3 年来的经验,总结出“4+2”发展战略,希望这些经验能为 AI 数据服务这个新兴行业带来更多有益的思考。


1. 全球视野。澳鹏公司是一家成立于 1996 年的公司,在技术和专业数据服务上都有深厚的全球行业经验和积累,而中国澳鹏团队的许多成员来自于全世界第一流的 IT 服务公司,由这样的全球化团队和技术来服务中国的 AI 企业,无疑可以帮助中国企业快速获得全球 AI 最佳实践,并为它们的业务出海极致赋能。


2. 研发技术领先、独立。澳鹏中国是知识产权独立自主的中国公司。澳鹏中国非常重视技术研发,在仅有 5、6 个人的时候就已组建了自研团队,目前中国团队开发的企业级 AI 数据标注平台叫做 MatrixGo,该平台在中国注册,拥有独立知识产权,与海外完全隔离。目前,每年约有 2000 个项目运行在 MatrixGo 上,平台技术在 2D、3D 图像标注领域是中国最领先的,极大增强了中国企业 AI 项目的规模化扩展能力。


3. 精益管理。澳鹏中国构建了一支来自于 IBM 等全球著名咨询公司的服务交付管理团队,拥有丰富的知识管理、SLA(服务水平)管理、质量管理、安全管理等经验,同时兼有对不同行业的深耕经验,使得澳鹏长期为全球高科技、汽车、消费电子、电子商务、金融服务、医疗健康及科研机构等行业提供高质量、高效的、安全的数据服务。


4. 交付能力及资源。目前,澳鹏中国总部位于中国 AI 之都上海,在无锡、大连、重庆均设有大型交付中心。目前,澳鹏拥有超过 1600 名全职员工、1000+BPO(商务流程外包)资源、数万名高质量的本土众包人员并持续扩张中。强大的交付团队能应对来自中国 AI 和互联网公司灵活多变的数据服务需求。


除了上述四项核心能力之外,澳鹏中国在行业和地域宽度和纵深方面也早已面向 AI 世界张开了自己的双臂。


1. 行业深耕。除了在澳鹏优势较为明显的自动驾驶、图像类等重点领域不断保持技术领先和突破,澳鹏技术人员还积极拓展新型细分 AI 行业,在如音乐、医疗、电子等领域提前布局,并把握元宇宙等未来方向。


2. 海外布局。越来越多的中国企业在海外市场大放异彩,在许多中国和全球消费者耳熟能详的手机、新能源汽车品牌“出海”的背后,都有澳鹏深厚全球技术积累的背影。


问:澳鹏对中国市场的持续投资持有怎样的态度?


田小鹏:澳鹏母公司持续看好中国市场,迄今为止已在中国市场投资数千万美元,未来将持续加大对澳鹏中国发展的投资。在澳鹏全球已有的 9 大服务中心的基础上,澳鹏中国还将进一步持续部署海外交付中心,助力中国企业出海至欧洲以及东南亚等地区,为更多中国本土客户的出海业务扩张提供贴身的交付服务。


做 AI 最好的“数据老师”


“伐来噻”“接翎子”“扎台型”……让 AI 听懂上海话,对一些头部国内智能语音服务巨头来说已经不是难事,而在这背后,如果你想教会 AI 一门新语言或方言,澳鹏也许就是那位最好的“老师”。


田小鹏介绍,在某个语音类国家级项目中,澳鹏中国就为客户提供了类似上海话语音包这样的服务。为了让 AI 拥有最好的上海话“素养”,澳鹏邀请上海师范学大学专门研究华东地区方言的专家合作,对照上海话正字转写方言字典,训练 AI 学到最正宗的上海话。


其实,上述案例仅仅是澳鹏中国海量案例中的一个缩影。无论上海话,还是拉脱维亚语,又或是多维图像标注、自动驾驶数据服务,澳鹏中国都致力于提供最高质量的数据标准。“有时候客户只要求数据准确率达到 95%,但澳鹏最终做到了 99.5%。”田小鹏强调,“质量、质量,在澳鹏的字典里,数据质量一定是被强调最多次的”。


澳鹏在行业、文化、语种等维度跨度广泛,并拥有语言学专家。例如在小语种转写场景,交付资源日活跃量超过 5000 人;在自动驾驶领域,2D/3D 融合标注产能达到 2 个月 1000 万帧,覆盖商用车、乘用车等各类车型。 


在而平台技术方面,有专家把澳鹏中国的 AI 数据标注平台比作“AI 数据标注的智能 ERP”,堪比改变了企业现代化、自动化流程管理的老牌 IT 公司经典 ERP 平台。


问:对 AI 和算法来说,什么样的数据是高质量的?


田小鹏:首先,训练 AI 的“种子选手”,一定得是最专业的。例如,上述案例中,高校的汉语言文学专家,就提供了最佳的培育 AI 的数据资源;又如,澳鹏在医疗类项目中,也会邀请专业的医师来帮助进行数据标注,这些都保证了最终 AI 算法获得的数据基础是高质量的。


其次,AI 数据标注工具也得是最好的。企业需要一套成熟的技术体系,MatrixGo 是澳鹏中国借鉴全球经验自主研发的高精度 AI 数据标注平台,好的数据治理工具能帮助企业事半功倍地高效达成目标。


再次,交付质量也是很关键的一环。澳鹏拥有非常强大的三轮质检,在采集、标准、交付等各个环节上都进行数据把关,确保最终数据的高准确率。


问:AI 在产业和生活中正变得无处不在,面向未来,澳鹏怎样看待 AI 在不同行业中的发展前景?


田小鹏:AI 应用经历了其自身发展过程,在中国互联网公司中,比较代表性的是,例如阿里将 AI 应用于电商行业,通过 NLP 自然语言识别,提升用户体验;而腾讯则将互动语音识别应用于微信等平台,包括后来的字节跳动等公司,都是语音文字场景国内最大的玩家。


近年来,澳鹏发现,以自动驾驶为代表的图像、影像数据服务需求增长迅速,自动驾驶汽车需要识别交通标志、行人、路况等。同理,线上课堂需要知道哪些孩子正在举手、哪些注意力不集中;医疗行业则在电子病历和医疗影像等领域发力……


根据澳鹏的观察,AI 应用正在渗透进入流通、教育、医疗等千行百业,澳鹏的优势是可以接触到所有这些行业,并与 AI 行业客户一起研判未来趋势,看准行业变迁的动向。最近,澳鹏与国内多家顶级制造业企业都有接触,AI 在工业、电力等领域的应用也正呈现快速发展趋势。


把数据关在“笼子”里


越来越多企业正意识到,数据是它们的核心竞争力之一,是“命根子”。但在 AI 应用的研发落地过程中,企业又必须与 AI 数据服务商合作,如何保证自己公司的数据在全流程中安全、可控,是几乎每个 AI 应用开发商都非常看重的关键环节,而这同样也是澳鹏和所有 AI 数据服务商的一道必答题。


“无论在美国、欧洲,还是中国,澳鹏都严格遵守当地的数据相关法规,并一如既往在整个项目数据周期中采取最严苛的数据权限管控、数据加密等数据安全管理和技术手段。”田小鹏说,“数据不会跑出去,从平台到接口,所有流程都在非常高标准的安全环境下完成”。


田小鹏进一步解释,所有客户数据不会保存在澳鹏的数据服务器上,而是采用第三方的中立云服务提供商,如果客户有需要,我们可以把平台直接部署在客户的私有云或服务器上,这样一来,所有的数据都被留在了客户的“仓内”。


澳鹏中国保障在封闭的安全空间内为客户提供高保密性的数据服务,主要是由位于大连和无锡的自建全职团队完成,团队规模 1000 人左右,而在非固定场地的项目,主要是借助澳鹏全球的超过 100 万众包资源实现交付。


问:如何看待安全在 AI 数据服务中的重要性?


田小鹏:在传统 IT 服务中,也许 10 家客户中只有一家需要签署 NDA 保密协议,而在 AI 数据服务项目中,澳鹏与客户之间 100%都签订 NDA 协议。澳鹏在安全和隐私保护领域都通过了国际权威机构 BSI 颁发的认证,BSI 是全球最优秀的认证机构之一,这是一件很严谨和严肃的事情。


问:澳鹏员工为客户工作时的真实状态是怎样的?


田小鹏:澳鹏办公室也许和大多数公司都不太一样。我们有一个概念叫做“项目室”,在澳鹏办公室内,人们会看到一间又一间的项目室,通常都是大门紧闭的,只有通过人脸识别门禁才能进入,只有该项目成员才能进入。不仅如此,澳鹏员工在进入工作状态前,是需要上交手机的,个别安全级别高的项目,工作人员还需要通过安检。所以,不管物理侧,还是网络侧,澳鹏都进行了彻底的安全隔离和管控。


问:客户是如何评价澳鹏在数据安全方面的工作的?


田小鹏:可以说,澳鹏在数据安全方面完全得到了用户的认可,许多客户都对澳鹏在这方面的努力非常认同。曾经国内某顶级互联网公司在来到澳鹏之前,走访了多家 AI 数据服务商,均不满意,该公司一度准备放弃,但考察澳鹏之后,对方却表示“相见恨晚”,迅速敲定了项目。而且至今为止,该公司都是澳鹏最优质的合作伙伴之一。


我至今还记得,当时对方项目负责人说:“澳鹏是我见过第一家安全管理做得如此之好的公司。”


借 AI 传递向善的力量


光山县,位于河南省东南部的一个小县城,曾是定点扶贫县。有一次,田小鹏意外地收到了来自光山县的特殊礼物,都是当地的土特产,用来感谢近年来澳鹏公司为当地乡亲父老谋的“福利”。


田小鹏坦言,这让他深刻感受到了“人心总是向善的”,由于澳鹏提供的 AI 数据标注项目,当地一部分人的收入得到了提升,这个小县城的人们做梦想不到自己能以 AI 为生,让 AI 数据服务成为自己的收入来源之一,“至少,这是一份崭新的收入,可以缓解就业问题,而且非常安全可靠”。


2022 年 10 月 14 日,国家农业农村部公布《关于公布 2022 年国家乡村振兴示范县创建名单的通知》,光山县赫然上榜。


田小鹏表示,在科技飞速发展的时代,人类本身应该不断改善、向善,人类也同时应该影响和训练 AI 不断改善、向善,“澳鹏中国虽然帮助了一些人,但我认为我们还在努力的路上,我们帮的人还不够多,也许未来某一天,我们可以帮助 10 万、甚至 100 万人。”


问:在国内,数据标注行业一线工作者常常由弱势甚至残障群体承担,他们的收入并不高,生存状态也并不太好,您如何看待这样的现状?


田小鹏:AI 数据服务行业是一个人赋能机器和算法的行业,所以首先我们最需要尊重的就是人。澳鹏不希望这个行业走偏,虽然价格永远是商业竞争中躲不过去的关口,但我们绝不能通过降低员工和从业者收入来提升商业竞争力。


有一位供应商曾对我说:“澳鹏是业界的一股清流。”因为澳鹏从不拖欠项目报酬,甚至自己出资为供应商垫付费用,这是澳鹏与合作伙伴之间的长期主义精神。


在澳鹏,拼的是管理和技术,好的管理可以省钱,好的技术同样可以提高效率。我们希望能把行业蛋糕做大,让从业者都能获得公平的报酬。如果有从业者没有获得应得的报酬,我觉得这是一件令人羞耻的事情。


问:澳鹏倡导怎样的行业生态?


田小鹏:我曾经收到过一封来信,写信的人是一位在读博士,他在东北的黑龙江,他不希望自己在这个年纪还向家里要钱,他希望用自己的知识打一份工,而我们的某个 AI 数据标准项目恰恰很符合他的专业,他可以凭借自己的知识和劳动获得相应的报酬,对此他表示感恩和感谢。


我甚至可以感觉到这是一个很上进的孩子,他在 AI 和自己擅长的领域之间找到自身的价值,并获得了回报。这是我们行业非常需要的——向善的力量。


作为全球和国内行业的领导者,澳鹏觉得自己有责任倡导 AI 数据服务行业走向更加健康的竞争生态,让更多的人来到 AI 这个新兴行业,并收获帮助。


澳鹏 APPEN

澳鹏 Appen Limited (ASX:APX) 是全球领先的图像、文本、语音、音频、视频等 AI 训练数据服务提供商,拥有业内最先进的人工智能辅助数据标注平台、一体化的 AI 数据及资源管理平台及全球 100 多万名技能娴熟的众包资源,支持 235+种语言和方言。澳鹏 Appen 的解决方案可为全球科技、汽车、金融服务、零售、制造和政府等行业的领导者提供优质、安全、高效的服务。澳鹏 Appen 成立于 1996 年,客户和办事处遍布全球。点此了解更多

发布于: 刚刚阅读数: 6
用户头像

澳鹏Appen

关注

还未添加个人签名 2021-03-15 加入

高质量的AI训练数据服务商

评论

发布
暂无评论
澳鹏中国第三年,缘何成为AI训练数据服务行业领头羊?_人工智能_澳鹏Appen_InfoQ写作社区