致广大、尽精微,曙光问道算力服务“神经系统”
历史上,生物有机体及其器官常常是科学家和哲学家们思考问题的“原型”。一个典型的例证是,计算产业从诞生的那一刻起,就与大脑结下了不解之缘。
众所周知,计算机正是以“大脑”为参照而诞生的。计算机之父冯·诺依曼在《计算机与人脑》一书中,将计算机与神经系统进行类比。以深度学习为核心的第三次人工智能浪潮,源于对人脑神经网络的模拟。类脑计算,被视为下一个极具潜力的技术突破方向。
大脑之于计算产业,具有某种“普适”价值。这种“普适性”也体现在,如果将目前如火如荼建设中的算力基础设施,与大脑的神经系统相类比,可以让我们对东数西算工程等的认识更为深刻,并从中获取灵感,以收获更好的产业效用。
如果说 IDC、智算中心等基础设施是负责生产算力的“神经元”,如火如荼建设中的东数西算工程则希望将幅员辽阔的算力连接成“神经网络”,而算力要传输到千行百业,则离不开 “神经中枢”——算力服务的协调与调度。
近期,中科曙光就以大脑神经系统为参照,推出“三位一体”算力服务原型,打通算力流通的关键环节:算力神经元-算力神经中枢-算力神经网络,以实现供需双方的流畅对接。
中国人常说,“物有本末,事有始终。知所先后,则近道矣”,曙光将生产侧和需求侧,如同神经系统一样连接起来,形成一个完整链路,颇有一点“道“的味道。
算力的流动,真的可以像人脑一样高效、智慧、低能耗,助力产业数字化的“知行合一”吗?
问道:算力向产业奔涌的神经“断点”
有来自西部地区的高校师生曾告诉我:AI 虽好,但板卡 GPU 太贵,优质算力资源对于经费有限的他们来说,十分奢侈;
有养猪场的老板表示:算力支出这部分预算是有的,也很希望引入 AI 做猪体温监测、猪脸识别,但 AI 应用的开发迭代门槛太高,招不到会用的人;
也有天文地理生物等科研院所的科学家表示,基础科学与先进计算的融合创新越来越紧密,但计算需求庞大,训练一个算法模型往往耗时许久,一旦过程中服务不稳定导致中断,就要重来,这个过程消耗了大量搞研究、做创新的时间和精力。
其实,这些朋友遇到的问题可以用一个词来形容,那就是:算力“断点”。
神经信号在传输中遭遇断点,放在人身上就是“偏瘫”。算力从生产端到应用端的整个过程中如果存在断点,就会出现供需错配,导致算力价值无法充分为产业所用。
以神经系统的运行模式为类比,能更清晰地理解算力 “断点”主要在何处——
1.供给端:多样化算力的断点。神经元收集信号并传递给神经中枢,正是因为有了视觉、触觉、听觉、嗅觉等多种神经信号,人类才理解丰富多彩的世界。在真实的数字经济中,千行百业对于算力的需求也是多元化的,需要多样算力融合供给。目前,一些算力中心资源比较陈旧,难以满足千行万业对多样化算力的需求。
2.连接通道:算力网络的断点。如果神经元信号在传输过程中遇到“断点”,人体自然也就接收不到大脑的指令。目前,全国的“算力神经元”还没有全面联结成网,算力资源在全国范围内还存在区域部署不均的情况。一些厂商的算力网络,只在某个区域内零星布局,没有互联互通,就会出现一些行业无法充分享用到海量、普惠的算力资源,而一些地区的算力资源却在空置,这也是东数西算工程搭建全国算力一张网所希望改变的局面;
3.需求端:垂直场景落地应用的断点。大脑指令通过神经系统传导到人体,激活相应的生理活动,人才能做到“知行合一”。而对于产业应用侧来说,人才缺失、技能缺失、经验缺失,自然很难用好算力、服务于数字化实践。算力想要转化为生产力,打通应用“断点”,离不开解决方案、产品服务等支持。
供需之间的这些断点,都是算力服务需要“粘合”的地方。不过,基建容易服务难。尽管不少头部厂商纷纷入局,提出了相应的服务方案,但多少还存在一些短板。
当整个行业都在呼唤一个标准、成熟、能够商业化落地的算力服务方案时,中科曙光率先提出了算力服务的“神经系统”,希望从根本上解决问题。
寻道:三位一体的算力模型
中科曙光推出的“三位一体”算力服务原型,正是以大脑神经系统作为参照,从宏观上打通一个个算力断点。
第一个供给侧的断点打通,依靠丰富算力资源的“神经元”。依托各地先进计算中心、智算中心,如同大脑构造中,负责存储电信号的百亿神经元,提供强劲、多元、高效、绿色的算力资源,为实现统一算力服务建立基础。
第二个连接侧的断点打通,得益于全面互联的“算力神经网络”。中科曙光将全国范围内多个计算中心进行统筹,形成一个算力资源池,实现了算力高度集成和一体化运营。
第三个需求侧断点的打通,则取决于一体化资源协同调度的“算力神经中枢”。基于 Access(通路)、Acceleration(加速)、Automatic Collaboration(协同)三大特征,算网中枢能够智慧化、定制化地匹配用户需求,为用户提供最优化的算力资源投资组合,让每一个用户需求“适得其算”。
通过 AC3.0 算网中枢,计算“算力投资组合”,判断某些任务应该到哪个地区的算力中心区进行计算,从而最大化满足产业应用的多样化算力需求。既可以让各类计算任务和客群都得到快速、高效的服务,也能够提高整个计算资源的利用率。
证道:算力神经中枢的价值几何?
人脑神经冲动的最高境界是“知行合一”,曙光“三位一体”算力服务原型,将生产侧和需求侧,如同神经系统一样连接起来,合为一体,加速算力落地应用。
通过曙光智算 AC 平台,算力得以源源不断地奔涌向广阔的产业原野,与科学计算、工程计算、人工智能三大领域深度融合。
以目前各行业智能化转型最迫切引入的 AI 为例,曙光智算就面向人工智能企业、高校与科研院所,推出了基于弹性计算 / 混合计算的人工智能算法训练环境,支持 TensorFlow/PyTorch/MxNet/PaddlePaddle/Parrots/MegEngine 等国内外主流深度学习框架,可支持万亿规模参数模型的训练,满足 AI 对超强算力的需求。并且由曙光提供的专业运维服务,按需付费,科研院所、企业组织无需自建、自行维护计算中心,大大加速了 AI for Science 的创新步伐。
此外,面向不同科研领域的个性化计算需求,曙光还进一步推出了气象海洋领域解决方案、生命科学领域解决方案等,提供差异化能力。以曙光智算联合深势科技开发的 Hermite Uni-FEP 药物设计平台为例,就基于“三位一体”算力服务原型,让整体计算速度加速比提升 10 倍,为生物新药研发提供算力支撑。
至此,算力才最终转化成生产力,丰富多彩的应用创新,共同点亮数字经济。
悟道:中科曙光的一以贯之
方兴未艾的东数西算,吸引了大量行业和企业来分一杯羹。其中,有术者纷纷,问道者难求。中科曙光能够率先看到全国算力网络建设中的“断点”,并以大脑神经系统为原型,打通一体化算力服务体系,这种“悟性”究竟从何而来?
中华自古就有“吾道一以贯之”的说法,中科曙光率先求道,正源于对计算产业的“一以贯之”。
在中国科学院的推动下组建,中科曙光 20 余年的发展,坚持以技术创新为基因,在高端计算、存储、安全、数据中心等领域形成了深厚的技术积累,也在全国范围内形成了算力优势。构建一个“中枢系统”,对于其他从业者来说也许很难,对于曙光来说,不过是水到渠成的一种必然。
人脑神经系统的特殊之处在于,既可以包罗万象,致广大于无边;又可以拆解成一个个电子、神经冲动,尽精微至末节。从这个角度理解算力之“道”,正包含着曙光对于计算产业的宏观理解和细节感知。
三位一体算力服务原型,是计算与大脑在新世纪的又一次精彩碰撞,也指向了下一个宏伟时代。
评论