解读下一代网络:算力网络正从理想照进现实
摘要:AI、5G 时代下,下一代网络的发展走向会如何?
在今年召开的《面向 2030 的新型网络》主题论坛中,业内专家给出了它们的答案。研讨会中,专家对于未来网络展望的关键词是:算力网络、确定性网络、内生安全。这三个词分别代表了产业对“未来网络的新愿景、需要解决的新问题、面临的新挑战”。
其中,算力网络是 2030 网络最关键的特征(新愿景)。其实从 2017 年开始,产业内就开始研究联接和计算的融合,之后又对下一代“联接+计算”的融合网络进行了展望,并逐渐形成了 2020 年产业对“算力网络”的共同愿景。
从网络 2020 到 2030,“联接+计算”成主流
网络 2020 主要是“彩蝶架构”,其特征是无线 RAN,光纤 FAN 两个超宽接入网,面向公众 Internet 骨干网和面向产业互联的 DCI 云骨干网,中间是融合的城域智能边缘。
如今,RAN 接入从 4G 到 5G,FAN 从 F4G 到 F5G,构建了面向个人和家庭的双千兆接入网,以及超宽的 DCI 云骨干网。
得益于“网络 2020”的架构转型,在新冠肺炎疫情期间,Zoom 和钉钉等成功支撑了数亿用户居家视频办公,实现了网络从消费娱乐到远程视频办公能力的显著提升。
围绕 AI 和行业数字化需求,业内希望下一代网络能够具备从目前提供“带宽+机房”的服务提升到“联接+计算”服务的新能力。
在 ITU FG-2030 工作组中,对网络 2030 的定位是“从联接人,到联接组织,到联接社会”,下一代网络的定位是成为联接未来社会、新通信业务和新基础设施的纽带。
智能社会需要算力网络
随着 AI 的出现和 CPU 处理器处理能力的大幅提升,机器算力已经逐渐逼近、甚至超越人类脑力。从引入机器大脑开始,人类就已经进入了“智能社会”。
但智能社会也存在三个阶段,从当前人脑指挥机脑的初级阶段,到人机协同阶段,再到未来人脑制定规则机脑自主执行的全息化“智能社会”。
在智能社会的演进中,对下一代网络的基础设施、通信能力也提出了新的要求。
未来社会将产生海量数据:全息智能社会和传统社会最大的区别在于各种感知终端将产生海量的原始数据,需要进行处理。
据有关预测,在人机协同阶段,来自大量 IoT 和视频采集信号的数据,将需要至少千兆的网络接入能力。在全息化阶段,如果需要将人的外观、触感、嗅觉、味觉等信息进行全息传送,未压缩数据就需要 4Tbps,即使压缩后也需要至少百 G 的接入带宽。
数据处理需要网络化算力新基础设施:智能社会产生的海量数据都需要大量的算力进行处理,根据罗兰贝格的预测,各行各业对于算力的需求将出现高速的增长,从 2018 年到 2030 年,自动驾驶对算力的需求将增加 390 倍,智慧工厂需求将增长 110 倍,主要国家人均算力需求将从今天不足 500GFLOPS,到 2035 年增加到 10000 GFLOPS。
终端算力在超过 128 核之后,经济性将面临瓶颈,云数据中心受到传输带宽成本和时延的影响,边缘算力将成为支撑智能社会海量数据处理的关键一环。
5G/WiFi6/F5G 打开了数据的水龙头,处理数据的三级载体云数据中心、边缘计算、智能终端将组成网络化算力新型基础设施。
新通信将为全社会提供智能服务:网络带给社会的价值就是其承载的业务,以前网络帮助人们建立了沟通渠道,承载了通讯服务;今天网络联接了端和云,带给人们丰富的内容,承载了内容服务;未来面向智能社会,网络将联接云、边、端,将海量数据传输到网络化算力基础设施,为万物带来智能。
其中,智能服务与内容服务对网络的要求不同,智能服务的流量流向将以上行为主,边缘处理为主,需要网络具备更大的上行带宽能力,对实时性要求更高,网络需要“确定性保障”。内容服务对实时性要求不高,网络仅需“尽力而为”。
考虑到未来社会需要给万物带来智能服务,所以算力网络需要满足以下三个特性:
算力网络要支撑海量数据的接入,未来 10 年需要从千兆到百 G 超宽带,IP 和光要支撑百倍的容量提升,云节点通过中心+边缘分布式支撑百倍容量的增长,边缘计算将分担数据中心和终端的算力增长不足。
算力网络要联接云、边、端网络化算力基础设施,构建专业化、弹性的算力资源池,支撑百倍增长的高效数据处理能力。
算力网络要支持算网协同,能够感知业务算力需求,为数据到算力提供最优路由和可信服务,并通过 IPV6 协议扩展,实现一个物理网络与多个虚拟网络统一管理,向上感知智能业务,向下感知网络资源,实现算力效率的进一步提升,并能够在网络资源不足情况下,为业务提供差异化 SLA 服务。
算力网络研究加速,业内发布最新成果
2020 年产业对算力网络的研究进入了一个新的阶段,目前算力网络相关标准已经立项,包括 ITU-T 5 项、MEF 1 项、ETSI 1 项、CCSA 2 项,并在网络 5.0 联盟(TC614)成立了算力网络特别工作组。
今年年底,产业也相继发布了最新的研究成果。
联通在《算力网络架构与技术体系白皮书》中提到,目前 SDN 已经实现了云和网的拉通特别是专线等级的连接,NFV 实现了核心网功能的全面云化。但是目前 SDN 与 NFV 的部署一般相互独立,各自自成体系。结合 5G、 泛在计算与 AI 的发展趋势,以算力网络为代表的云网融合 2.0 时代正在快速到来。
云网融合 2.0 是在云网融合 1.0 基础上,强调结合未来业务形态的变化,在云、网、芯三个层面持续推进研发,结合“应用部署匹配计算,网络转发感知计算,芯片能力增强计算”要求,实现 SDN 和 NFV 的深度协同。
联通定义的“算力网络体系架构”是指在计算能力不断泛在化发展的基础上,通过网络手段将计算、存储等基础资源在云-边-端之间进行有效调配的方式,以此提升业务服务质量 和用户的服务体验的计算与网络融合思路架构。
移动在《泛在计算服务白皮书》中将“泛在计算”定义为“通过自动化、智能化调度,人们可在任何时间任何地点无感知的将计算(算力、存储、网络等)需求与云-边-端多级计算服务能力连接适配,通过多方算力贡献者和消费者共同参与,实现算力从产生、调度、交易到消费的闭环,实现算网一体、算随人选、算随人动的可信共享计算服务模式”。其具备四个主要特征:算网融合,算随人选,算随人动,可信共享。
电信提出“网络是边缘计算的核心能力之一”,建议以边缘计算为中心,重新审视和划分对应的网络基础设施,并将网络划分为 ECA(边缘计算接入网络),ECN(边缘计算内部网络),ECI(边缘计算互联网络)。其中,算力网络是联接与计算深度融合的产物,通过成熟可靠、超大规模的网络控制面(分布式路由协议、集中式控制器等)实现计算、存储、传送资源的分发、关联、交易与调配。并将网络架构划分为“应用资源寻址”,“算法资源寻址”和“基础资源寻址”三层,实现多维度资源的关联、寻址、交易和调配等。
实现“联接+计算”的服务化,首先是要构建 SLA 量化分级体系,联通与华为完成了《面向业务体验的算力需求量化与建模研究报告》,信通院发布了《5G 切片端到端 SLA 需求研究报告》,分别对计算和联接的服务量化分级给出了建议。
5G+AI 是行业发展业务的关注点,也是算力网路的最佳试验田,在第三届“绽放杯”参赛的 4289 个项目中,有 55%的项目与 AI 相关,边缘计算的使用率也达到了 49%。
算力网络还需构建两个关键能力
计算和联接分级量化只是算力网络落地的起点,面向社会提供泛在算力服务还需要实现 AI 设计自动化,减少面向企业提供服务过程中需要高级专家的参与的问题,这需要解决两个技术挑战:从数据到算法的 AI 应用算法的自动化设计工具、从 AI 应用到联接+计算资源的“AI 应用环境(联接+计算)自动规划工具”。
如果把 AI 应用场景划分为设计态和运行态,这两个关键技术都属于设计态的工作,目前的算力网络技术架构中对运行态考虑比较充分,但对设计态则比较欠缺。
AI 应用的自动化设计工具:类似电商平台的“千人千面”引擎,可以基于企业提供的数据和需求,自动完成算法推荐和超参数调优,核心是让非 AI 领域专家也可以自动构建 AI 应用程序。
近年来,深度学习在各个领域得到了应用,在图像分类、物体检测、语言建模等领域,都得到了应用。由于 AlexNet 在 2012 年 ImageNet 大型视觉识别挑战赛(ILSVRC)中超越了所有其他传统的手动方法,因此越来越复杂和深度的神经网络被提出来。例如,VGG-16 有 1.3 亿多个参数,占用近 500 MB 的内存空间,处理一张 224×224 大小的图像需要 153 亿次浮点运算。
然而,值得注意的是,这些模型都是由专家通过试错和手工设计的,这意味着即使是 AI 专家也需要大量的资源和时间来创建性能良好的模型。为了降低这些繁重的开发成本,近年来出现了将机器学习(ML)流水线自动化的新思路,即自动机器学习(Automatic Machine Learning)。
AutoML 设计的目的是减少对数据科学家的需求,使非 AI 领域专家也能够自动构建 ML 应用程序,而不需要过多的统计和 ML 知识。自动机器学习(Automated Machine Learning, AutoML)成为无需人工干预的 DL 系统的一种有希望的解决方案,现在越来越多的研究者开始关注 AutoML。
AI 应用环境(联接+计算)自动规划工具:根据算法和客户数据处理的实时性需求,自动分解出需要的算力(TOPS),存储,网络带宽和时延的要求。这个软件类似网络规划工具,区别是要把“计算和联接”资源一体化考虑,客户可以在设计前增加一些约束条件,比如带宽,时延约束等。
商业上为了进一步简化,可以参考信通院《5G 切片端到端 SLA 行业需求研究报告》的分级思路,将联接需求映射到带宽、时延等几个等级,计算可以参考 CCSA TC1《面向业务体验的算力需求量化与建模研究报告》将算力需求映射到算力、存储等几个等级:
企业在内部测试验证时,也可以参考计算和联接服务等级定义,并考虑到一定的冗余,从而可以快速将 AI 应用与计算+联接的资源服务之间形成映射关系,容易实现算力标准化、和应用的跨平台迁移,从而加速算力网络的商业化进程。
理想照进现实,算力网络将起航
算力网络自 2019 年被业界提出以来,在联接和计算的 SLA 分级、泛在计算架构、算力网络技术架构等研究方面已经取得了显著的进展,面向行业数字化转型的万亿市场,结合“5G+AI”需求,以算力网络为代表的下一代网络转型即将起航。
本文分享自华为云社区《解读下一代网络:算力网络正从理想照进现实》,原文作者:技术火炬手 。
版权声明: 本文为 InfoQ 作者【华为云开发者社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/c2db3ce933cdc700720e1d625】。文章转载请联系作者。
评论