深度学习框架“国货”正当时，但要警惕无差别投入的“产业陷阱”

关注
发布于: 2020 年 08 月 20 日
最近，美国推动的一系列科技封锁政策让人瞠目结舌。我们习以为常的世界科技秩序，毫无疑问正在以肉眼可见的速度被改变甚至重构。
﻿
在这样的话语氛围下，底层技术自主可控开始成为社会各界的共识与推动方向。而在科技产业进程里，半导体与计算机操作系统代表着过去有亏欠、今天急于填补的技术门类，也就是我们在今天能够清晰感受到被“卡脖子”的那些技术。而另一类则是中美大体处在齐头并进阶段，需要积极发展的“未来技术”。所谓昨日因今日果，如果我们不希望未来再次被卡脖子，那么今天这类技术也必须保持独立可控，甚至高速发展反超欧美——AI技术就是这个领域的代表。
﻿
﻿
（去年GitHub就突然限制克里米亚、古巴、朝鲜、伊朗和叙利亚等国家用户访问）
﻿
在发展AI技术的进程里，最关键的开发底座相信读者已经很熟悉，那就是深度学习框架。在几年前，我们就专门讨论过深度学习框架独立自主的战略意义，今天来看已经一一应验。而国产深度学习框架发展到今天这个阶段，又出现了很多新的动向。在这个阶段我们需要的可能就不仅是简单的中美框架对标与扶持，而是更具有智慧、有策略，有合理产业节奏的方式去推动技术底座良性发展。
﻿
在此过程中，盲目执行平均主义的资源分配和产业推动，可能是最大的问题。进入深度学习框架发展新阶段，合适的产业策略应该是既期待和推动百花齐放，又能找到成为栋梁之材的佳木。
﻿
皆木皆花不是景。只有内在系统完善，发展机制合理的生态系统，才能培育起茁壮的中国AI丛林。
﻿
名实陷阱：深度学习框架发展新阶段需要警惕什么？
﻿
在产业AI不断发展的今天，AI底层技术工具和平台受到了社会各界，乃至世界各国的普遍重视。但在相关产业成果不断涌现的过程里，也势必因为AI技术是全新事物，缺乏产业通行的判断标准，导致政府、资本、媒体、产业，各领域的话语表达方式不一致，彼此理解差异很大，这导致后续行动的依据也不同。
﻿
举个例子，众多技术平台和工具进入大众视野，基本都会冠以首个、独家、突破这类的字眼。搭配上看似强大的资本与团队背景，很容易让行业外人士产生过高的心理预期。无论在芯片、操作系统，还是AI、大数据领域，我们已经见过太多类似的问题，甚至闹剧。这类现象可以称之为自主科技产业上的“名实陷阱”。
﻿
这就像铁和金都是金属，但价值显然不同。但由于大众层面缺乏对科技产业的专业认知，就很难辨别名称相近平台的实际差异。
﻿
这一点在深度学习框架的发展中，也已经开始体现。今年以来，不仅谷歌TensorFlow、Facebook的PyTorch、亚马逊的MXNet三大美国框架不断更新，国内很多深度学习框架也宣布向业界开源开放。比如一流科技自研的Oneflow深度学习框架、旷视科技的深度学习框架天元（MegEngine）等等。当然，每个框架背后都充斥着开发者的梦想和心血，也会在一些训练任务上展现出独特的优势。但如果我们横向对比这些新框架，会发现它们在核心技术、工具完整性、生态布局上有些参差不齐的缺失，甚至达不到国内老大哥“飞桨”的标准。那么如果从政策、资本、产业合作等层面都给予同样的赋能，显然会造成无差别大水漫灌的问题。
﻿
﻿
（飞桨全景图体现了全面的核心技术与完整的工具集）
﻿
事实上，到底如何定义什么是完整的深度学习框架，是一个非常专业化的产业问题。比如早在2018年，阿里开源了旗下的X-Deep Learning，称其为“业内首个面向高维稀疏数据场景的深度学习开源框架”。而事实上XDL只能面向高维稀疏数据场景这一种需求，能力范围狭小，很快也就在开发者中不见了踪影。
﻿
同样的窘境在新近开源的深度学习框架中体现的尤为明显，像Oneflow这类技术轻骑兵，往往只针对单一的产业需求，会出现能力范围和工具性、生态性、产业特性的欠缺。而深度学习框架作为AI时代的操作系统，又恰恰是需要聚少成多、长期积累的领域。如果引导产业和开发者无差别入驻，那么显然会造成内部凝聚力失衡，无法形成有效生态的问题。
﻿
那么是否有办法，在产业周期中建立一个关于深度学习框架的判断机制呢？
﻿
三维模型：如何建立AI产业的价值判断机制？
﻿
我们当然不会认为深度学习框架一定就是老的好、新的差，或者强者恒强，大者通吃。也不认为新型深度学习框架就没有出现的必要，或者缺乏产业机遇。恰恰相反，百花齐放的产业形态是业界开始兴旺的表现。只是我们认为无论在产业政策、资本扶持，抑或产业合作上，都应该建立标准化、多元化的价值评判机制，引领深度学习框架向合理性、高效率发展。避免平均主义造成资源浪费，也避免大众听到创新和独立字样都等而视之，造成公共情绪的错误引导。
﻿
回归到深度学习框架领域，一个健康的价值判断模型，需要检测多个维度来审视一款产品或者平台的发展：
﻿
首先，在当前的科研大环境下，核心技术自主权和底层技术自主可控的价值已经非常明显。政策制定者、产业各界与媒体，应该坚定支持国产框架发展，甚至推动AI产业生态从美国框架向国产框架迁移，毕竟在目前的局势下，谁也无法判断下一个断供的是不是TensorFlow。
﻿
然而，仅仅下载使用来支持是不够的，就像操作系统一样，深度学习框架本身难度很大，但更具挑战性的是生态的发展和汇集。相关政策与产业标准，也应该更加关注AI开发者生态，围绕生态需求制定针对性推动策略。在这方面，一个显著的指标就是开发者的数目，这能直观地体现生态繁荣程度，就拿飞桨举例，它已经凝聚超过210万开发者，而且正在通过自己的生态化规模将AI能力拓展到各行业，在产业阶段，理应得到更高的重视。
﻿
最重要的是，深度学习框架要体现出对国家经济转型升级的推动力，按现在的政策，就是深度学习框架是否能够负载今天新基建周期中，产业智能化带给深度学习框架的工业级承载需求。这个标准又包含几个部分，比如核心技术的完整、领先，能够负载大规模深度学习；另一方面是平台体系与技术能力对于工业化大生产领域的支撑能力。但大部分的深度学习框架交出来的成绩单都还没达到要求，要么是覆盖面狭窄，要么是企业不满意。如果向飞桨看齐，它已经覆盖通信、电力、城市管理、民生、工业、农业、林业、公益等众多行业和领域，在疫情期间也落地大显身手，目前已有9万家企业通过飞桨创建了超过29.5万个模型， 这些产业指标，显然是深度学习框架价值的最好判断标准，也是后来者亟需突破的方向。
﻿
在深度学习框架走向百花齐放的当口，我们希望能够避免眉毛胡子一把抓，达成重点分明、产业逻辑清晰的扶持策略与产业引导行为。
﻿
产业策略：推动AI底座整体发展的当务之急
﻿
对于AI基础设施来说，百花齐放的产业形态，甚至开发者纯粹兴趣式的创造都非常具有价值。但如果我们的目标是发展符合社会经济需求的工业化AI底座，通过新基建推动产业智能整体发展，那么就需要制定详实、完整的产业策略，推动深度学习框架与众多AI基础设施一道，向AI工业化大生产发展。在这样的目标下，有几件当务之急值得多加重视：
﻿
首当其冲的是，重点发展一个体系，有策略进行平台、数据、开发生态的打通。最佳方案是以发展度最好的深度学习框架为依托，有效整合再创新，与产业沟通，避免重复发明轮子，防止政策扶植、资本、社会舆论的资源错置或浪费。同时积极推动国产化、自主可控的深度学习框架发展。当然不是说要刻意规避美国优秀技术成果，但在目前阶段和国际形势下，积极推动甚至政策推动深度学习框架国产化、自主化，似乎已经是题中应有之义。
﻿
﻿
（国务院印发的《新一代人工智能发展规划》也提到了扶持深度学习框架的目标）
﻿
其次，技术评判标准的建立，是细化核心技术发展目标的关键一步。将深度学习框架拆解为更为详细的产业维度，厘清各平台的优劣势与发展所处阶段，是目前政府和业界需要共同完成的任务。例如深度学习框架能否保持高频升级迭代节奏，来解决产业不断涌现的新问题？核心框架的开发能否变得越来越便捷，让开发者和企业更容易上手？更别说需要大量具有突破性的新技术，来满足产业智能化转型过程中面临的门槛与痛点。在这些问题上，飞桨做的比较好，他们具备突出优势，核心技术发展方向也很明确，可以有效帮助产业快速发展，让社会资源对平台的价值判定更具标准化方案。
﻿
而且从另一个方向上看，不同的框架处在不同的发展周期，自然也需要不同的发展推动力。比如飞桨在产业核心能力上的特性、开发生态与产业应用上的积累，目前是其他框架所不具备的。建立关键技术的评判标准化体系，可以避免“大小班同上”，让发展领先的深度学习框架向下一个产业阶段进行探索，承担更重的社会价值。
﻿
而最关键的还是，深度学习框架必须要融入产业生态，建立起对社会经济的灌溉体系，否则就会为技术而技术，沦为空中楼阁。深度学习框架之所以重要，完全建立在AI技术可以赋能产业，提升社会生产力的基础上。那么发展深度学习框架自主化、国产化，也建立在技术平台与产业需求的高效对接与产业适配上。从这个角度看，在检验深度学习框架的价值与发展潜力时，也必须将其与行业结合的案例、效率、平台可行性纳为基础评判准则。比如说，飞桨推动大工业生产的可行性，正体现在对产业的适配和大量案例上。新冠疫情期间，就有大量AI应用高效产出并在各个防疫领域发挥作用。2月13日，飞桨开源了业内首个口罩人脸检测及分类模型，随后，包括中石油、北京地铁在内的百余家试用企业纷纷应用落地。
﻿
﻿
（飞桨开源的口罩人脸检测及分类模型，助力复工复产）
﻿
此外，根据报道，百度与OPPO的合作中，提供了飞桨大规模分布式训练等技术能力，将OPPO推荐系统业务模型训练速度提升了8倍，模型扩大了20倍，推荐场景效果提升了4%-5%，节省了90%的内存，对于OPPO覆盖全球3.5亿用户的移动互联网服务起到了很大助推作用。
﻿
还有一个走出国门的案例是，基于飞桨打造的一款无人机自主飞行平台，已经在东南亚某国提供自主巡逻、火情监测、非法入侵、森林树木砍伐监测等功能方案，相比人工巡检效率提高200%，森林覆盖面积从40%提升到100%，对当地森林防火工作提供了肉眼可见的助益。
﻿
在互联网、科技行业，以及工业、农业、能源、金融，乃至公共卫生与社会服务等领域的广泛落地，也是市场选择深度学习框架的一种体现，此前IDC发布的《中国深度学习平台市场份额调研》显示，深度学习市场形成谷歌、Facebook、百度三强态势，三者占据了国内超过一半的市场份额，由此可见一斑。从这些角度看，在国产深度学习平台自主可控创新的最佳契机与平台化底座的选择上，飞桨已经建立起了较为明显的优势。
﻿
当然，这只是对国产深度学习框架主流平台选择及扶持的一种思路，这也体现出，在我们重新审视AI产业发展周期与深度学习框架发展赋能时，或许需要更加体系化、生态化、产业指向的目光，来审视不同平台的差异化战略价值。
﻿