写点什么

专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升 50%

发布于: 4 小时前
专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%

作者 | 涌月


Eureka 是一款优秀的注册与发现产品,其作为 Netflix 公司重要的开源项目,已经成为 Spring-cloud-netflix 生态默认的注册中心。在过去的数年中,Eureka 为大量的中国互联网公司提供了开箱即用的注册中心服务解决方案。


但由于 Eureka 开源社区停止维护,并且在业务规模增大的时候存在性能问题,因此需要寻找一个可替代的高性能注册中心,进行平滑迁移和演进。


Eureka 的性能问题

Aliware


随着业务的发展,Eureka 逐步暴露出一些性能问题。上万量级实例的频繁变更、洪水般的流量请求,即便通过部署高配服务器,也无法解决 Eureka 的性能瓶颈:


1、服务状态更新滞后:由于 Eureka 存在缓存机制,基于其搭建的微服务系统通常会出现服务状态更新滞后,30-60s 才能够获取到准确的服务实例列表;


2、同步速度慢:当业务流量大时,为了保证高可用和高性能,通常 Eureka 需要以集群模式运行。然而,Eureka 集群之间的读写同步速度相对缓慢,即在一台 Eureka 上注册实例,需要等待较长延迟之后,才能在另一台机器上查询到相关信息,导致了业务出现经常线上 Bug。



Eureka 的社区问题

Aliware


除了上述的性能问题外,Eureka 社区当前已经宣布停止维护(如下图),锁死在一个不发展的社区上有很高的技术风险和不确定性。



MSE 注册配置中心专业版的优势

Aliware


为了降低 Eureka 技术体系停止维护的不确定性,并增强 Eureka 注册中心的稳定性和高并发能力,我们首次在 MSE 注册配置中心专业版(以下简称专业版)上完全兼容了 Eureka 协议,并对其读写性能、实例容量进行了大幅优化。


某大型教育机构用户反馈,相对于开源 Eureka,专业版性能大幅提升,目前已经在其业务场景中落地。专业版的核心能力和性能表现如下:


1、多协议支持:用户使用 Eureka 注册中心的实例,完全可以使用 Nacos 协议进行发现,保证用户技术栈的多层次兼容性;


2、高性能支持:极大地优化了读写同步速度,使得基于此搭建的微服务系统具有更高的性能和易用性;根据实验室的压测数据,MSE-Nacos 下的 Eureka 注册中心的读写性能、实例容量均提升达 50%以上。


3、融入服务网格生态:通过支持 MCP 协议和 XDS 协议,服务网格生态领域已完全兼容专业版的 Eureka 协议,为 Istio 接入 Eureka 提供零侵入、高性能的微服务以及网关解决方案。


1


对比压测报告


我们对开源 Eureka 和专业版,在读写性能、容量评估上进行了压测,主要包括如下两个场景。


  • 场景 1: 容量评估测试


注册尽可能多的 App 和 Instance,并维持心跳,观察注册中心的容量。测试指标包括 Instance 容量、是否发生 Full GC 以及 CPU 开销。实验机器包括 3*8C16G 或 10*8C16G,我们进行了不同注册规模的多次压测实验。



容量方面,Eureka 容量较小,3 台机器容量超过 1.5w 就会出现大量同步超时报错,频繁发生 Full GC(每分钟至少发生一次)。


经过问题定位,Eureka 在容量测试场景中,其集群间批量复制较为频繁;另外,开源 Eureka 在初次超时之后,很快会将复制请求重试,导致泛滥,这是造成 CPU 飙升接近 100%的主要原因。该问题也导致了 Eureka 的横向扩展性能瓶颈。


而专业版的容量超过 Eureka,只需 9 台机器就可以支持 6w 左右的实例规模;另外,其 Full GC 的频率大大降低,CPU 使用率维持在较低水位。


  • 场景 2: 读写性能 TPS 测试


经过测试发现,Eureka 在大量频繁的写操作场景中,其集群间批量复制操作更加频繁,导致大量的 Timewait 线程;另外,Eureka 在初次超时之后,很快会将复制请求重试,导致泛滥,这是造成 CPU 飙升接近 100%的主要原因。其表现形式是,在 Eureka 的 CPU 打满之后,Eureka 端会出现下方的报错,每台节点的响应速度达到瓶颈。


com.sun.jersey.api.client.ClientHandlerException: java.net.SocketTimeoutException: Read timed out
复制代码


而专业版采用阿里云自研的 Distro 协议,对于数据进行分片,其集群间的数据同步粒度相对于开源 Eureka 更小。因此,专业版兼容的 Eureka 集群间数据同步量相对较低,CPU 开销较小。其 TPS 提升,RT 下降,整体性能提升了约 50%。下面,我们再分别从读场景和写场景,分别对专业版和 Eureka 进行比对:


读场景


写场景


如何将开源 Eureka 迁移至专业版

Aliware


相信看到这里,你一定想早点上车,但是你接着会问,是否支持无缝迁移呢?我们针对不同的场景分别提供了对应的解决方案。


1


云上自建 Eureka 用户如何迁移?


云上自建 Eureka 用户,可以直接按照 《将 Spring Cloud 应用从开源 Nacos 迁移到 MSE Nacos》平滑迁移(见文末链接)。


2


已经购买 MSE 的用户如何迁移?


对于已经购买了 MSE 注册配置中心基础版的用户,我们也提供了平滑升级至专业版的能力。可以直接通过点击“实例规格变更”,并选择“专业版”进行操作。




整个迁移过程完全平滑,业务基本无感知。升级完成之后,用户便可以在专业版上,进行高性能的 Eureka 协议服务发现与注册了。


参考链接

《将 Spring Cloud 应用从开源 Nacos 迁移到 MSE Nacos》:

https://help.aliyun.com/document_detail/263565.html


双十一大促,微服务引擎 MSE (注册配置中心和云原生网关)首购 8 折优惠!

点击下方链接,了解更多!

https://cn.aliyun.com/product/aliware/mse

发布于: 4 小时前阅读数: 4
用户头像

云原生技术是云时代释放云价值的最短路径。 2020.06.11 加入

还未添加个人简介

评论

发布
暂无评论
专业版再增强 | MSE 无缝兼容 Eureka 协议,性能提升50%