对谈阿里云祝顺民:经济复苏,云网络如何加速企业效率提升?
InfoQ《极客有约》栏目近日邀请到了阿里云智能云网络产品线总经理、阿里巴巴达摩院 XG 实验室负责人祝顺民(花名江鹤),一起来聊聊经济复苏正当时,云网络如何加速企业效率提升。以下是本期内容,经编辑整理有增减。
疫情改变了很多人的生活方式,也改变了很多企业的经营方式和对云技术的看法。Gartner 预测,到 2025 年,过半企业在公有云计算领域的 IT 支出将超过传统 IT 服务支出。
2023 年经济开始复苏,效率提升成为不少企业在 2023 年的主要课题之一。作为企业上云的第一步,云网络也将迎来不小的机遇和挑战。那么,经济复苏给云网络带来了哪些变化,而云网络又将如何促进企业提升效率、加速发展?
漫谈经济复苏的征兆和变化
3 月 15 日国家统计局的数据显示,经济运行整体已经呈现企稳回升的态势。行业分析里对于经济复苏也普遍比较期待和乐观。这种变化会给云计算产业带来哪些影响?
祝顺民:近年来国家出台大量数字经济相关支持政策,推动数字经济加速发展,云计算作为数字经济和产业数字化的重要底座,有望受益于经济的复苏和行业的整体发展。我国企业上云渗透率相对较低,仍存在巨大增长空间。其中,泛互联网企业上云渗透较为充分,而政企及传统行业逐渐成为上云主力。
随着经济开始复苏,很多传统企业、制造业企业开始关注数字化转型的主题;很多出海企业会考虑如何搭建海外基础设施、实现国内外互联互通。整体来说,大家对国家经济与企业竞争力的前景都是比较有信心的,身为云计算产业中的一员,我也能感受到云计算产业在这样的背景下的关注度在不断上升。
技术创新最终还是要落地到业务场景,才能显现价值。对于云计算的一些需求的变化,落到行业场景里会可能更明显。从云或者云网络领导厂商的视野,您观察到哪些变化和趋势?
祝顺民:互联网类的企业,比如音视频、游戏、在线教育等,对市场反应更敏感。一方面,它们更考虑业务的高速增长,然后借助出海拿到更大的市场份额。这个时候就可能更注重弹性、高并发、全球大带宽互联等;另外一方面,增效降本也是企业考虑的一个重点。
对于传统企业来说,比如制造业、交通物流等,应该还是加大数字化和上云力度,以此来实现增效降本。而且随着一些传统企业国际化业务的展开,需要考虑全球化办公分支的互联。总体而言,对外要应对经济全球化、业务出海等竞争环境的变化,对内要苦练内功,通过一些云计算等数字化手段,实现增效降本、增强自身竞争力。
这些变化会反过来影响云、云网络开发者和从业者对产品和技术点的关注重心吗?
祝顺民:前些年大家更多关注前沿技术,现在客户最需要的是稳定性,要求业务能够稳定、可延续地运转。其次是安全,一方面体现在业务系统的安全性上,希望业务系统不要被黑客攻破、脱库;另一方面是数据的安全性,越来越受到企业的重视;再次是云端产品的性能需要满足需求。最后是关键因素——成本。阿里云一直在不断思考如何让用户在降本方面能够获得更多收益,比如利用云计算等技术帮助企业将自动化、智能化、可视化等手段运用到实际业务中。
不同行业对云网络需求有哪些变化?
如果汇总 2023 年很多企业的年度关键词,可能“数字化转型”是一个,“效率提升”也是一个。从云网络的角度,您是怎么理解技术先进与企业发展之间的关系?
祝顺民:首先,阿里云或者说是阿里云网络的技术先进性是有目共睹的。国际上,获得了 Gartner 全球产品能力测评云网络领域的第一名;国内,获得了国家计算机学会技术发明一等奖和浙江省技术发明一等奖。但我们没有必要去追求技术的绝对的先进性,合适才是竞争力,技术的领先是为业务需求服务的。比如网络延迟,我可以举一个例子,很多企业会想:要不要把我的业务系统部署在离我最近的数据中心?但在实际应用中,企业对于延迟的需求真的需要达到那么低吗?
To C 和 To B 角度来看不太一样。To C 角度,VR 眼镜,尤其是 4K 的 VR,互动类的游戏,对延迟要求是非常高的。我们曾经做过一个测试,用 5G 技术来支持办公室里几个 VR 眼镜的通信,5G 的延迟大概在 15 毫秒。15 毫秒什么概念?2 个毫秒可以来回 50 公里,15 毫秒就是超过 350 公里。其实现在很多 To C 的应用,对延迟的要求并没有到这么高的程度。
但是在 To B 场景里,比如工业场景,15 个毫秒可能延迟还是太高了。我相信未来产线里面机器与机器之间的交互和控制,对通信时延要求会越来越高的。虽然过去十多年技术变革是互联网应用引领到,但是我认为未来的技术变革将是工业的场景应用来引领的。
企业上云网络先行。但是全球数据中心数量在持续增加,很多地区的云价格却越来越贵,这是否会影响企业构建云网络的方案选择?
祝顺民:我可以从几个方面来谈。
第一点,阿里云的成本售价实际上是在持续走低的,因为阿里云的服务器、网络和存储规模越来越大,大家在上面共享的资源越多,释放出的成本节约红利也越大。
第二点,有些企业上云后觉得贵,其实是没有充分利用云的优势,比如说我们可以用按量计费的模式来根据需求调整云端带宽、存储的用量,这样可以节约很多成本。企业在使用云的流量的时候,既可以按照带宽购买,也可以按流量购买,按需求时间分配和使用流量,也能够降低总体的成本。这使得企业可以更加灵活用云。
举个例子,有一家企业做大促活动,将增量访问放在阿里云上,只用半个小时就完成了部署,活动 1 小时,后半个小时释放,总耗时两个小时,一共只需支付 400 块钱。假如不选择云服务而是购买设备,其成本大概要 5 万元,部署时间至少要 7 天。就单场活动而言,选择云服务在资金上至少节约了 100 倍,时间成本至少节约了 160 倍。所以说,每家企业的业务系统部署的方式都不太一样,企业要综合考虑各方面的成本。很多企业有专职岗位来做云端资源的运营优化,来尽可能降低云的使用成本。
从最开始关注公网接入能力到现在,企业对于云网络的关注指标是否有一些变化?
祝顺民:大多数的企业用户不会明确说对哪些指标提出特别的要求,但优秀的指标是客户体验的保障。对于云网络而言,ECS 组网规模、带宽大小、并发访问数量、时延等这些指标都是关乎网络体验的重要指标,是一直需要关注的。比如弹性,如果你能做到弹性足够大,或者说单实例性能 / 带宽,ECS 规模足够大等等,那么意味着用户一次购买的实例资源,可以满足很长时间的业务需求,那么这个弹性体验就很好。
从追求更高性能,到现在希望云网络回归初心,这种变化会带来哪些技术挑战?上一次您做客《极客有约》我们就聊到过面对数字化转型需求要做技术储备,现在这种储备是充足的吗?
祝顺民:从回归云计算的初心来讲,就是安全、稳定、性能、成本。阿里云网络力争为客户提供稳定可靠的全球互联能力,打造简单易用的访问体验;规模、性能、弹性等都是原生就具备的能力;比如说企业出海,需要跨地域网络构建。如果企业没有做网络架构设计或者冗余性没设计好,影响是非常大的。我们发现国外的用户对 API 的依赖度非常高,类似这样的现状是云厂商必须要接受的事实,反过来就会对云厂商提出更高的要求。
面向新的挑战,我们需要思考提供更强有力的产品能力,不仅仅是性能高,规模大;而是能够更好的满足客户的业务需求,也就是回归云的本质,需要更加理解客户的业务场景;我们在用户层面的产品理念就是更加简单、易用,能够让用户更加高效。自适应的弹性,让网络更简单。
我举个生活中的例子,比如我们去 A 饭店吃饭,当点 3 个菜的时候会发现上菜很快,当点 10 个菜的时候会发现上菜非常慢。而我们去 B 饭店吃饭,点 10 个菜依然上菜很快。这说明弹性对于不同云厂商而言,能力是不一样的。而阿里云可以提供的是支持过多年双 11 的超大规格的弹性能力,这个上限是非常高的。我们为业务增长快的出海企业提供了一分钟快速扩容的方案;联通集团在阿里云上提供跨境的专线服务,企业向联通购买之后,分钟级别就能开通。这都是自适应超大弹性的体现。
如今阿里云的用户遍布各行各业,像传统制造业中的化工消费电子企业对于云的要求相对比较高。我们有一个做物联网平台的客户,提出的需求是负载均衡实力要能够并发管理 1 亿个终端。针对这个需求,我们排除万难攻坚掉了所有技术难点,最终测试到了 1 亿并发。还有一个客户要求一个负载均衡支持 1T 流量,诚然你可以拆成很多个负载均衡,但用户在管理上又会变得更加复杂。阿里有一句话叫做:“把复杂留给自己,把简单交给别人”,所以,我们在去年把吞吐实力提升到了 500G,现在马上要发布 1T 的能力。这样既满足客户业务流量的需求,又让客户这张网更简单易用。
技术提升的背后是阿里云围绕稳定、安全、性能、成本的持续精进和追求。
云网络如何加速企业效率提升?
不同行业不同企业对于云网络的需求不同,在经济复苏的背景下,您观察到哪些企业最先有一些动作?
祝顺民:我们看到传统行业用户在阿里云上的占比越来越高,可见我们现在的企业国际竞争力是在大幅度提升的。另外我们看见互联网企业也在积极出海,在海外对阿里云的资源诉求越来越大。
这些企业在试图构建安全、稳定、高效的云网络时,往往会遇到哪些难点和痛点?从云网络的视角来看,帮助企业提升效率,阿里云目前是否有一些相对成熟的思路?
祝顺民:我也认为网络很复杂,它四通八达的连接特性带来了复杂度。企业想要实现提效,可以从“建网—用网—管网”三个阶段入手。
建网方面,如果你需要能够快速开通网络应对频繁的业务变化,需要能够快速打通资源节点,最好选择配置简单、能够自动化一键组建全球化网络的云服务。用网方面,不仅需要高质量、低时延、大带宽的云网络服务,还要关注稳定可靠。以带宽需求为例,企业对于大带宽的需求一般因时间波动,云网络支持按时间调整带宽需求,就可以支持企业更经济用云。管网方面,一旦网络出现问题,不仅能够快速定位,还能够快速反馈解决办法,这就需要网络具备可观测性和智能可诊断。
我们也在想很多的办法能够把云的网络变得更加简单易用。第一,我们会把产品设计得更加简单一些,不需要大家有很多的专业网络背景就能把网络搭建起来。第二,我们也逐步在阿里云上提供网络运维的产品(NIS 网络智能分析系统),现在是免费提供提供给阿里云的客户使用的。这意味着我们把网络上虚拟机等资源的状态、网络连接状态呈现给用户,提供可观测性。
我们内部有一个“抹零战役”,如果你用阿里云有问题的时候可以到阿里云上提一个工单,我们希望的目标是把工单的数量降为 0。看起来这个目标无法实现,但阿里云是用这个目标在牵引自己,把产品体验、服务质量、可观测性这些能力尽可能提供给用户,提升阿里云的可用性、易用性。
另一方面,确实对于云来说,我们很难做到用户所有需求都能满足,因为用户种类特别多,他用云的方式、场景、诉求都不太一样,所以我们也会跟一些生态合作伙伴,比如研究网络安全的公司、研究负载均衡的公司联合起来。
这里我提醒一下,作为用户一定要想清楚,首先你是不是自己有能力去构建端到端的所有能力,第二就是当你无法自己构建的时候,一定要想一下今天这个领域里有谁能够帮助你去解决这个问题。
让网络变得更简单,目前我们有一些成果吗?
祝顺民:其实今天你会发现,使用云网络已经不需要考虑这么多,门槛已经大幅下降,业务弹性已经大幅提升了。客户可以将更多的时间省下来关注到自身业务发展上去,而不必过多为 IT 运维而操心。
比如说,我们和 EMQ 映云科技通过双方的技术合作,打造了亿级物联网连接平台,满足全球物联终端连接和管理。基于我们 NLB 产品构建大规模分布式物联网 MQTT 消息服务器,可以支撑亿级物联设备的并发连接,以及数百 Gbps 的超大吞吐能力。
我们协助英国石油构筑了全球一张网,支撑其在亚太业务的高速发展。在这个过程中,客户使用我们的云网络产品打造了一张中国及亚太的企业级云网络,支撑业务高效增长,同时通过精细化运营降低资源使用成本。
在音视频直播领域,我们为客户提供云网络智能观测和运维服务。借助 NIS 实例自检诊断和路径连通性分析等,发现和修复了一些网络异常,业务流量分析可以发现一些 NAT 异常访问流量等;路径分析可以覆盖到网络中每个节点,快速定位网络不通的问题。
以上这些例子都是让网络更简单的一种体现。云的本质实际上是整个社会上企业和企业之间的一种资源共享的模式,可以避免你自己单打独斗造成的很多资源浪费。
阿里云围绕着稳定性、安全、性能、成本这些需求,都是持续在追求技术进步的。我们从来没有停下技术突破的脚步,因为我们认为上云是不会停下来的,云一定会变成全行业社会级别的基础设施,规模会越来越大,会对技术不断提出更高的要求。应对人类社会不同时期发展的需求,技术的变革将是一个永恒的主题。
评论