实验室里的 AI 激情:腾讯优图的升级修炼之路
一百多年来,信息技术从初兴到成为基础设施,成就了无数辉煌的科技巨头。如今,人工智能也正狂奔在通往社会通用性技术的路上。
要从上一波信息技术浪潮的产业规律中预测出AI的航海图,并不容易。但回到历史现场,也能悟出一番道理。
比如一个广为认可的事实是,几乎所有闻名遐迩的技术大厂背后,都有着或大或小的实验室支持。其中不少都为人类通信领域做出过巨大贡献,更是不乏诺贝尔奖和图灵奖获得者的身影。
毫不夸张地说,顶尖实验室的存在,像是硅谷第一公民肖克利的实验室,AT&T的贝尔实验室,IBM的IBMResearch实验室,施乐公司的帕罗奥图研究中心PARC……等等,奠定了硅谷的创新水位,也为后续近百年的信息产业革命提供了肥沃的技术土壤。
而这样的产业发展惯性,也自然而然地延续到了人工智能领域。诞生了机器学习框架TensorFlow的谷歌人工智能实验室,孵化出智能助手小冰和小娜的微软研究院,亦或是国内诸多巨头的各种实验室和研究中心,成为智能经济的重要支撑。
其中,作为腾讯AI技术双引擎之一的优图实验室,就是一个不容忽视的存在。与其他实验室的不同之处在于,从2012年成立至今,历经了三次重要迭代升级的优图,可以说用8年时间走完了通信时代实验室的世纪历程。
当我们在AI狂奔的高速度下试图进一步求解,科技企业的历史机遇点、基础研究与产品商业价值的鸿沟如何消弭等基本问题的时候,优图的升级修炼之路,未尝不是一个绝佳的参考坐标系。
朝阳初升:安静角落里的技术“突围者”
不同的产业阶段,实验室所扮演的角色也各不相同。
比如通信技术方兴未艾的产业发展初期,依靠实验室完成底层技术突破,拉升企业竞争优势的天花板,是最常见的诉求,也是实验室成立的初衷。
所以我们会看到,近年来科技巨头们不断招揽AI大咖加盟工业界,谷歌实验室请来了最重磅的专家——人工智能先驱、图灵奖得主Geoffrey Hinton;Facebook的人工智能实验室负责人Yann LeCun同样是AI界的传奇。
吸引科技工作者的向往和追随,不仅烧钱(年薪不菲),而且无法快速看到收益。对于将企业利益放在首位的商业机构来说,为什么要做这件事?
要寻找答案,我们不妨将时间倒带到1925年,从最成功的贝尔实验室中,探寻技术研究之于科技企业的核心价值。
很多人都知道,AT&T公司拿出产值的百分之三用于贝尔实验室的研发工作,不愁经费的贝尔实验室也在当时成为信息领域科学家的首选工作单位。当然,他们的加盟也为AT&T公司贡献了难以估量的价值,比如信息论的发明、第一颗通信卫星的发射、第一条商用光纤的建立等等,无数创新,让AT&T长期在通信领域领先于世界。
技术研究之于商业价值的先发优势有多重要,从腾讯的AI版图中就可以看出来。
腾讯从最初的布局,到在自身业务、云服务等中全方位应用AI,与优图实验室的研究不无关系。
2012年成立之初的优图实验室,最早是做图片的二次压缩,很快将研究重心心转移至人脸识别识别、检测方向,到现在聚焦整个计算机视觉,进行相关的技术研发与储备。
在1.0阶段,优图的核心是拉升腾讯的技术水位,在视觉AI上不断精进。
2015年,优图基于深度学习的理念研发了优图Uface人脸识别算法,并于同年在LFW数据库上评测,以99.56%的准确率,名列世界第一。
2017年,优图研发出“优图祖母模型”, 深度从10层至1000层,可以应对所有场景数据,解决对各种“异源数据的融合”。
这些技术成果,多次创造了世界纪录,拿下了不少AI专利的腾讯,也一跃晋升为全球AI技术研发的第一方阵。
感知技术潮头的深刻变化,通过积极探索来捕捉产业变局,是优图1.0阶段与AI世界建立联系的关键意义,也为腾讯切入智能经济抢占了先机。
骄阳如火:挖掘商业富矿的支撑者
变化出现在2018年。
2018年9月,优图实验室升级为腾讯计算机视觉研发中心,由此进入2.0阶段。
一方面,腾讯对优图的研发投入进一步加码;同时,优图锚定了“基础研究+产业落地”双轨前进的路线。
时任腾讯高级执行副总裁的汤道生提到,优图专注探索社交娱乐、工业生产、社会进步、前沿探索“四大方向”,围绕医疗、自动驾驶、工业、零售、办公、文化、社会公益等“十大领域”深入场景创新。
在技术上“跑高分”,在业务上“跑场景”,这一路线靠谱吗?
回到上世纪90年代,通信科技从探索期走向实用化和成熟期,一大标志就是实验室的商业化。
比如IBM Research,其规模只有贝尔实验室全盛时期的十分之一,但极富创新能力,成为当时世界第一专利申请大户。而特点正是基础研究与产业应用的结合。
当时的IBM实验室砍掉了一些偏重于理论而没有效益的研究。一旦一个研究项目可以使用,就将整个研究组从实验室挪到产品部门。
不得不说,在AI与商业市场如此贴近的今天,技术的进步与商业场景的融合更加密不可分。
2018年,优图实验室面临的环境是,人工智能技术已经完成了算法的原始积累,革命性的突破开始减少。
与此同时,各行各业开始认识到人工智能的价值,产业端渴望技术加持的诉求十分强烈。这一时期,实验室如何完成从技术基础开发到产业部署探索的体系化之路?
升级后的优图就选择了拥抱场景。
优图的工程师说,当时感觉优图不是一个独立的实验室,更像是一个腾讯内部的业务支持部门。针对各个业务线和B端企业的需求,去做相应的技术支持。
而在腾讯内部丰富场景的锤炼下,凭借集聚优势的数据资源,优图的基础技术与场景融合很快完成。许多人脸识别、图像识别相关的基础研究,被包装成SDK或标准服务的方式,通过行业解决方案输送出去。
内部业务中,已经在QQ、QQzone、微信、微视、腾讯云等超过90余个自有产品线中落地;
同时,与企业客户合作的行业标杆案例,也在这一阶段蓬勃爆发。
比如和宁波银行一起推动各项AI技术等在金融领域的应用;与企业用户推出以OCR为核心的智能核保和智能票据解决方案;微信支付的刷脸支付功能在上海家乐福投入使用;辅助华星光电超过100道工业质检,与中国南方电网合作进行的电网智能巡检……等等。
用优图员工的话来说,“客户有时不太清楚自己的业务想要什么,所以优图及其他架构师、项目经理的一起加入,共同分析在项目里面怎么用(视觉AI)更合适”。
可以说,在AI积极融入产业视角的凶猛浪潮中,优图实验室的“基础研究+应用落地”的两条腿模式,成为腾讯AI贯穿新产业纪元的重要保证。
AI高照:无处不在的智能托举者
在最近举办的世界人工智能大会上,优图实验室的“人设”又发生了新的变化。
6月10日,优图实验室宣布正式开源新一代移动端深度学习推理框架 TNN。这一消息透露出了两个命题:
1.腾讯优图进一步开源,AI生态托举者的角色继续垒实;
2.移动端AI开发的门槛进一步降低,腾讯吸纳新一代开发者的姿态清晰化。
这一次升级的契机又是什么呢?
如果要在计算机通讯领域找到对标的实验室,并不那么容易。因为通讯产业与AI产业的逻辑最本质的不同是,人工智能从一开始就是开源的。
AI技术决定了它需要开放共进的生态环境,来实现技术的加速生长;另外,来自现实应用中的创新与迭代,是AI繁荣不可或缺的原动力。
所以,开源成为全世界众多实验室“进一步成果回馈”的共识。谷歌、苹果、Facebook等在内的AI巨头都在开源社区上有积极的布局。
而升级2.0的优图一直在融入全球AI开源生态上动作不断。
比如与美国科学促进会官方刊物《科学》(Science)系列战略合作,共享在计算机视觉领域的资源和信息,把自己已经成形的技术平台、模型或神经网络等构架直接开放给平台上的全球科学家,来共同推动CV技术的发展。
再比如借助腾讯优图开放平台,将人脸识别、图像识别等多项领先世界的算法能力,通过云端服务为用户开放调用。
此外,借助 Rapidnet 前向计算框架、RapidAIoT 边缘计算框架,以及业界首个专注移动端的推断框架 ncnn 的开源,让更多开发者更容易触摸AI。
那么3.0阶段,优图的开源又有那么不同呢?
一方面,优图在基础研究层面,占据了“桥头堡“地带,在产业协同上承担更多的平台责任。
仅2020年,优图被国际CV顶级会议CVPR接受了17篇论文。这些领先的创新成果,通过开源和平台型产品,释放更大的AI价值,是3.0阶段的优图所渴望承担的社会意义。
所以我们看到,正式开源新一代移动端深度学习推理框架TNN,就以优异的性能、轻量级开发、简单实用等特色,让移动端AI面向更多开发者打开。
另一方面,移动互联网的发展告诉我们,基础设施型平台是战略级别的竞争。以安卓和IOS生态为例,想要进一步激活商业创新价值,就需要将绝大多数的AI开发者、用户都吸引到自己的开源环境上。
只有使用自家工具链及工具生态的开发者越多,就越可能在商业生态扩展上让被人无法追赶。
从这个角度来看,优图首次开源深度学习框架TNN,帮助开发者更轻松地去开发人工智能App,对于滋养端侧的商业生态,催生AI在端侧场景下的创新应用,意义非凡。
这对于让AI变成智能时代无处不在的必需品,如同水、电、WiFi一样成为现代生活的底色,值得给予更大的期许。
从2012年成立至今,优图的八年也是这一波人工智能浪潮从初兴、爆发、理性融合的崛起路程。
优图从“技术-平台-场景”的升级修炼,让视觉AI走向实用化探索,在产业领域落地生根。整个路程,如同信息技术技术蝶变的百年缩影。
实验室模式、天顶技术、商业社会,也在此时此刻,让优图成为智能未来最直观的叠影。
评论