百度研究院的追星逐浪,中国科技的奋发自强
最近,互联网公司的技术责任与时代使命一下成为社会热议的话题。
而在争议的另一面,则是很多互联网公司并没有忘记星辰大海。技术指向的未来依旧清晰,中国科技产业在这条道路上也依旧步履未停。
在诸多技术中,AI 或许是最能代表人类共同价值的那一项。2018 年,世界经济论坛主席施瓦格教授提出人类第四次科技革命的核心力量是 AI、清洁能源、机器人等新一代智能技术。当 AI 的价值成为全球共识后,社会各界都开始关注这门技术。但早在此之前很久,就已经有公司拔锚启航,向智能世界的星辰大海出发。
最令我们熟悉的案例就是百度。
在这个时代,AI 绝对是通往星辰大海的通衢,但去往智能时代的路上并非一帆风顺,甚至根本没有路,需要我们亲手去修建一条出来。既然最近大家都在讨论互联网公司与星辰大海,那不妨重新读读百度与 AI 的故事,或许能拥抱一些启发。
远航的帆,码头的船
2021 年开年,互联网大厂就有传来了 AI Lab 关闭的消息。其实这一批 AI Lab,不少是在 2017 年 AI 技术在围棋炒作下突然火热后成立的。换言之,成立的目的或许未必是看到了清晰的价值方向,有跟随风向,与投资人、股市与舆论达成交代的嫌疑。如今宣布关闭,多少令人感到唏嘘。
不过,这也从侧面看出 AI 技术落地产业之路并不易,可快速复制的行业创新已经稀少,带着噱头的东西无法经受现实与时间的考验。
自然,行业也不乏技术信仰者。从前身 IDL 开始,聚焦于人工智能前瞻基础研究、探索技术前沿方向的百度研究院已走过八年时光,下设大数据实验室、生物计算实验室、认知计算实验室等九大实验室,囊括了从底层基础到感知、认知技术的 AI 全领域范畴。这背后是百度在 AI 领域的长期主义和笃定的投入、布局。
刚刚,百度研究院还发布了 2021 年十大科技趋势预测。回望去年的预测可以发现,百度研究院的年度趋势预测精准度较高,产业方向都在一一应验。
在今年的预测中,百度研究院集成了近年来的产学研发展方向,与社会经济的智能化需求。比如在 AI 核心发展方向上,预测了后疫情时代 AI 将与大众生活更加紧密。
而在这一趋势下,技术层面边缘智能、无监督学习、生物计算将成为 2021 年的重点,而在产业层面,数字交通、服务机器人、虚拟人将带来全新机遇。向更远处看,量子产业正在兴起,AI 相关的社会责任与人才培养工作将被持续重视。可以发现,这些方向融合了技术与学术路径、产业风向,以及未来布局和社会责任,构成了 AI 技术与 2021 年的立体化交织。
远航的帆,将看到大海深处的风景;只能停留在码头,不怎么下水的船,却只能在风雨声响起时盖上帆布。
而 AI 时代的船,本来就应该在海上,在乘风破浪、追逐星辰的路中。是不是有风声催促他们,其实不重要。
航海家的手里,有星辰和茧子
互联网和高科技公司应该去追寻星辰大海,这一点在今天已经构成了共识。但星辰大海是一个说起来特别简单和美好,做起来却又苦又累的工作。远方不仅是美好的智能时代,还有复杂的技术攻关、繁琐的基础设施搭建、持续的产业推进,以及时时刻刻注视更远处的自省。百度布局 AI 领域,已经经历了十一年。而其中大部分时间并不是享受风口上的赞誉,或者智能化带来的商业价值,而是扎实推动每一厘米的技术创新,让 AI 由实验室走向产业的过程坚实可信。
在十大趋势发布的背后,我们可以看到百度研究院在视野上的远近结合、布局上的成熟与立体。百度研究院代表的是整个百度在前沿技术领域的研究和持续的投入,在 2020 年它不仅展现出 AI 基础技术上的创新、平台上的优化,也展现出了对国计民生的承担,对下一个时代的仰望。
举几个例子,在 AI 最重要也最根本的基础技术创新层面,2020 年百度大脑实现了“知识增强的跨模态深度语义理解”的核心突破。让 AI 算法可以理解真实世界的复杂场景。百度提出了 ERNIE-ViL,将场景图知识融入预训练,刷新 5 项多模态经典任务的世界最好效果,登顶视觉常识推理任务(VCR)榜首。
在平台化基础设施层面,百度打造的飞桨是中国首个开源开放、功能完备、自主可控的产业级深度学习平台。2020 年,飞桨开源框架升级了 V2.0RC 版本,带来“编程一致、动静统一”的全新开发体验,代码开发更加简洁,降低迁移成本,同时为深度概率编程、量子机器学习等前沿学术研究提供更好的支持。
目前,飞桨已经凝聚超过 265 万开发者,累计 commit 16 万次,开源贡献者超过 5000 位,发展飞桨开发者技术专家(PPDE)97 位,基于飞桨训练 34 万个模型,服务 10 万家企业。在 IDC 公布的 2020 年下半年深度学习框架平台市场份额报告中,百度与 Google、Facebook 居于中国深度学习平台市场综合份额前三,其中,百度综合市场份额位列第二,与位列第一的 Google 几乎持平。可信可用的基础设施,与繁荣的产业生态都需要漫长时间的布局、打磨与信赖建立。无数行代码叠加,或许才是追逐星辰大海的真相。
而在应用层面,百度研究院布局的先进 AI 技术在 2020 年也立下了赫赫功劳。面对疫情,百度迅速开源了线性时间算法 Linearfold,将病毒全基因组二级结构预测从 55 分钟缩短至 27 秒,提速 120 倍。同时,百度推出的全球首个 mRNA 疫苗基因序列设计算法 LinearDesign,能在 16 分钟内大大提升疫苗设计的稳定性和蛋白质表达水平,从而有效解决了 mRNA 疫苗研发中最重要的稳定性问题,加速疫苗研发速度。全球抗疫的阵地上,百度用 AI 撑起了一面独特的盾牌。
面向更远处的前沿方向,最有可能改变人类未来的量子计算,百度在 2020 年发布了国内首个云原生量子计算平台量易伏 Quantum Leaf,提供 QCompute 等量子开发套件,缩短量子编程全生命周期,实现量子工具链闭环;此外,量子脉冲计算服务量脉 Quanlse、量子机器学习工具集量桨 Paddle Quantum 全面升级,构建起百度量子平台为核心的量子生态。
种种故事或许可以告诉你,航海家的手中不仅有星辰,也有厚厚的茧子;而这些茧子,才让追逐星辰大海成了可能。
三道港湾,十一年航程
2020 年或许可以看作是百度 AI 的收获之年,无论是行业排名、商业回馈还是股价快速增长,都见证了百度 AI 引擎的全面启动。但对于百度来说,十年收获也仅仅是第十一年出发的序曲。我不知道百度研究院的专家们,听到大众舆论响起“互联网公司应该追逐星辰大海”时的反应如何。或许根本没有反应,或者即使听到也并不在意。毕竟今年的算法还要更新,架构还要升级,星辰大海和日常工作,早就别无二致了。
当然,他们的工作不会浪费,他们的情怀和坚守也应该被大众看到。执着技术,穿过风雨,第十一年拥抱 AI 的百度,在我看来抵达了三道港湾。
第一道港湾,名叫“远眺未来”。
科技公司要能够持续把未来拉近,需要对技术的预判和笃定。这其中要经历大量不计成本、无人支持的守候。十一年前,百度在根本没人听过深度学习的时候就笃信 AI 的价值,百度研究院从前身到今天,已经持续长达八年的研究布局。敢看到很远,也敢孤守十年,才能把远方拉近。在今天百度研究院于量子计算的故事上,似乎也是如此。
第二道港湾,名叫“家国自立”。
这几年来,中国科技“卡脖子”的问题不断浮现。而解决卡脖子其实也没有其他办法,只有自己掌握核心技术,坚持科技自立而已。过去中国在半导体产业的落后,造成了今天被动;而如果今天在 AI 上重蹈覆辙,只能将隐患留给未来。为了解决核心技术自主化的问题,百度开发了国内首个深度学习平台飞桨,研发了远场语音交互芯片百度鸿鹄,并且坚持开源开放战略,让中国科技走向世界。
第三道港湾,名叫“技术普惠”。
产业智能化浪潮发生之后,AI 技术开始成为各行业解放生产力的关键。而百度的核心 AI 能力则通过百度智能云赋能千行百业。2020 年,百度明确了“云智一体”发展战略,应对 AI 工业大生产中千行百业的智能化需求,百度智能云提出了 AI-Native 的云计算架构。在基础设施的 AI 计算集群、AI 芯片到工程平台的飞桨、云原生以及到应用平台的视频云、区块链等,通过云智一体,端到端的方式,便捷高效的支持产业的智能应用。基于“壮智凌云”加速产业智能化,将 AI 技术无缝接入千行百业,成为了众多产业这一年发展的全新契机。在众多事关国计民生的重要领域,都可以看到百度智能云与行业建立了紧密联系。比如在智慧城市、智慧金融、智慧能源、工业智能化等领域中搭建的产业赋能机制,加强了技术普惠通道。通过 AI 技术的大规模行业落地,百度的 AI 航海成为了大海上的新灯塔,为各行业的探索者照亮路途。
回到互联网公司面向星辰大海的问题。“星辰大海”这四个字,特点就是说出口太容易,一步步去做却太难。利益、局势、风口,太多东西能让一家科技公司转舵,放弃长期的技术目标,回归“几颗葱,几头蒜”的流量。
但也有些东西能够支撑远航。比如笃信的方向消解纷扰与离乱,以家国情怀遮盖长跑的疲惫,以技术的温度融化时间的寒冷。
怀中千里志,不觉十年苦。这是百度何以去星辰大海。
评论