对 Spring Cloud+Nginx 架构的主要组件不清楚,看这个就好
公众号:Java 架构师联盟,每日更新技术好文
Spring Cloud+Nginx 架构的主要组件
以 crazy-springcloud 开发脚手架为例,一个 Spring Cloud+Nginx 应用的架构如图 1-1 所示。
图 1-1 基于 Spring Cloud+Nginx 的应用架构
Nginx 作为反向代理服务器,代理内部 Zuul 网关服务,通过 Nginx 自带的负载均衡算法实现客户端请求的代理转发、负载均衡等功能。
Zuul 网关主要实现了微服务集群内部的请求路由、负载均衡、统一校验等功能。虽然在路由服务和负载均衡方面,Zuul 和 Nginx 的功能比较类似,但是 Zuul 是自身注册到 Eureka/Nacos,通过微服务的 serviceID 实现微服务提供者之间的路由和转发。
Eureka、Nacos 都是 Spring Cloud 技术体系中提供服务注册与发现的中间件。Eureka 是 Netflix 开源的一款产品,提供了完整的服务注册和发现,是 Spring Cloud“全家桶”中的核心组件之一。
Nacos 是阿里巴巴推出来的一个开源项目,也是一个服务注册与发现中间件,它用于完成服务的动态注册、动态发现、服务管理,还兼具了配置管理的功能。Nacos 提供了一组简单易用的特性集,用于实现动态服务发现、服务配置、服务元数据及流量管理。
由于新版本的 Eureka 已经闭源,而阿里巴巴的 Nacos 除了具备 Eureka 注册中心功能外,还具备 Spring Cloud Config 配置中心的功能,因此大大地降低了使用和维护的成本。另外,Nacos 还具有分组隔离功能,一套 Nacos 集群可以支撑多项目、多环境。综合上述多个原因,在实际的开发场景中,推荐大家使用 Nacos。但是,本文出于学习目的,注册中心和配置中心的内容还是介绍 Eureka+Config 组合,其实在原理上,Nacos 和 Eureka+Config 组合是差不多的。
除了一系列基础设施中间件技术组件之外,微服务架构中大部分独立业务模型都是以服务提供者的角色出现的。一般来说,系统可以按照各类业务模块进行细粒度的微服务拆分,例如秒杀系统中的用户、商品等,每个业务模块拆分成一个微服务提供者 Provider 组件,作为独立应用程序进行启动和执行。
在 Spring Cloud 生态中,微服务提供者 Provider 之间的远程调用是通过 Feign+Ribbon+Hystrix 组合来完成的:Feign 用于完成 RPC 远程调用的代理封装;Ribbon 用于在客户端完成各远程目标服务实例之间的负载均衡;Hystrix 用于完成自动熔断降级等多个维度的 RPC 保护。在 Nginx+Spring Cloud 架构中还存在一系列辅助中间件,包括日志记录、链路跟踪、应用监控、JVM 性能指标、物理资源监控等等。本文并没有对上述辅助中间件做专门的介绍。
Spring Cloud 和 Spring Boot 的版本选择
Spring Cloud 是基于 Spring Boot 构建的,它们之间的版本有配套的对应关系。在构建项目时,要注意版本之间的这种对应关系,版本若对应不上则会出现问题。
Spring Cloud 和 Spring Boot 的版本配套关系如表 1-1 所示。
表 1-1 Spring Cloud 与 Spring Boot 的版本配套关系
表 1-1 Spring Cloud 与 Spring Boot 的版本配套关系
Spring Cloud 包含一系列子组件,如 Spring Cloud Config、Spring Cloud Netflix、Spring Cloud Openfeign 等,为了防止与这些子组件的版本号混淆,Spring Cloud 的版本号全部使用英文单词形式命名。具体来说,Spring Cloud 的版本号使用了英国伦敦地铁站的名称来命名,并按字母 A~Z 的次序发布版本,它的第一个版本叫作 Angel,第二个版本叫作 Brixton,以此类推。另外,每个大版本在解决了一个严重的 Bug 后,Spring Cloud 会发布一个 Service Release 版本(小版本),简称 SRX 版本,其中 X 是顺序的编号,比如 Finchley.SR4 是 Finchley 大版本的第 4 个小版本。
大家做技术选型时非常喜欢用最高版本,但是对于 Spring 全家桶的选择来说,高版本不一定是最佳选择。比如,目前最高的 Spring CloudHoxton 版本是基于 Spring Boot 2.2 构建的,Spring Boot 2.2 又是基于 Spring Framework 5.2 构建的,也就是说,这是一次整体的、全方位的大版本升级。大家在项目上会用到非常多的第三方组件,总会有一些组件没有来得及进行配套升级而不能兼容 Spring Boot 2.2 或 SpringFramework 5.2,如果贸然地进行基础框架的整体升级,就会给项目开发带来各种各样的疑难杂症,甚至带来潜在的线上 Bug。
除此之外,Spring Cloud 高版本推荐了不少自家的新组件,但是这些新组件没有经过大规模实践应用的考验,其功能尚待丰富和完善。以负载均衡组件为例,Spring Cloud Hoxton 推荐的自家组件 springcloud-loadbalancer 在功能上与 Ribbon 的负载均衡功能相比就弱很多。
Spring Cloud Finchley 到 Greenwich 版本的升级其实很小,可以说微乎其微,主要是提升了对 Java 11 的兼容性。然而,在当前的生产场景中 Java 8 才是各大项目的主流选择,另外 Java 11(2019 年 4 月之后的升级补丁)已经不完全免费了。当然,和 Java 11 一样,Java 8 在 2019 年 4 月之后的补丁版本也面临收费的问题。使用 Java 8 的理由是,自 2014 年 3 月 18 日发布起至目前,Java 8 被广泛使用,且被维护了这么多年,已经非常成熟和稳定了。
综上所述,本文选用了 Spring Cloud Finchley 作为学习、研究和使用的版本,推荐使用的子版本为 Finchley.SR4。具体的 Maven 依赖坐标如下:
Spring Cloud 微服务开发所涉及的中间件
在基于 crazy-springcloud 脚手架(其他的脚手架类似)的微服务开发和自验证过程中,所涉及的基础中间件大致如下:
1.ZooKeeper
ZooKeeper 是一个开放源码的分布式协调应用程序,是大数据框架 Hadoop 和 HBase 的重要组件。在分布式应用中,它能够高可用地提供保
障数据一致性的很多基础功能:分布式锁、选主、分布式命名服务等。
在 crazy-springcloud 脚手架中,高性能分布式 ID 生成器用到了 ZooKeeper。
2.Redis
Redis 是一个高性能的缓存数据库。在高并发的场景下,Redis 可以对关系数据库起到很好的缓冲作用;在提高系统的并发能力和响应速度方面,Redis 至关重要。crazy-springcloud 脚手架的分布式 Session 用到了 Redis。
3.Eureka
Eureka 是 Netflix 开发的服务注册和发现框架,它本身是一个 REST 服务提供者,主要用于定位运行在 AWS(Amazon 云)上的中间层服务,以达到负载均衡和中间层服务故障转移的目的。Spring Cloud 将 Eureka 集成在子项目 spring-cloud-netflix 中,以实现 Spring Cloud 的服务注册和发现功能。
4.Spring Cloud Config
Spring Cloud Config 是 Spring Cloud 全家桶中最早的配置中心,虽然在生产场景中很多企业已经使用 Nacos 或者 Consul 整合型的配置中心替代了独立的配置中心,但是 Config 依然适用于 Spring Cloud 项目,通过简单地配置即可使用。
5.Zuul
Zuul 是 Netflix 开源网关,可以和 Eureka、Ribbon、Hystrix 等组件配合使用,Spring Cloud 对 Zuul 进行了整合与增强,使用它作为微服务集群的内部网关,负责给集群内部的各个 Provider(服务提供者)提供 RPC 路由和对请求进行过滤。
6.Nginx/OpenResty
Nginx 是一个高性能 HTTP 和反向代理服务器,是由伊戈尔·赛索耶夫为俄罗斯访问量第二的 Rambler.ru 站点开发的 Web 服务器。Nginx 源代码以类 BSD 许可证的形式对外发布,它的第一个公开版本 0.1.0 在 2004 年 10 月 4 日发布,1.0.4 版本在 2011 年 6 月 1 日发布。Nginx 因高稳定性、丰富的功能集、内存消耗少、并发能力强而闻名全球,并被广泛使用,百度、京东、新浪、网易、腾讯、淘宝等都是它的用户。OpenResty 是一个基于 Nginx 与 Lua 的高性能 Web 平台,它的内部集成了大量精良的 Lua 库、第三方模块以及大多数的依赖项,用于快速搭建能够处理超高并发的扩展性极高的动态 Web 应用、Web 服务和动态网关。
以上中间件的端口配置以及部分安装与使用的演示视频如表 1-2 所示。
表 1-2 本文案例涉及的主要中间件的端口配置以及部分安装与使用的演示视频
Spring Cloud 微服务开发和自验证环境
在开始学习 Spring Cloud 核心编程之前,先来介绍一下开发和自验证环境的准备、中间件的安装以及抓包工具的准备。
开发和自验证环境的系统选项和环境变量配置
首先介绍开发和自验证系统的选型。大部分开发人员学习开发都用过 Windows 环境,在这种情况下,强烈建议使用虚拟机装载 CentOS 作为自验证环境。为什么要推荐 CentOS 呢?
1.提前暴露生产环境中的问题
在生产环境上,90%以上的 Java 应用都是使用 Linux 环境(如 CentOS)来部署的。因此,使用 CentOS 作为自验证环境可以提前暴露生产环境中的潜在问题,避免在开发时没有发现有问题的程序,一旦部署到生产环境中就出现问题(笔者亲历)。
2.学习 Shell 命令和脚本
在生产环境中定位、分析、解决线上 Bug 时,需要用到基础的 Shell 命令和脚本,因此平时要多使用、多练习。另外,Shell 命令和脚本是 Java 程序员必知必会的面试题。使用 CentOS 作为自验证环境能方便大家学习 Shell 命令和脚本。
当然,可以借助一些文件同步或共享工具提高开发效率。比如,可以通过 VMware Tools 共享 Windows 和 CentOS 之间的文件夹,这样在后续的 Lua 脚本的开发和调试过程中能避免来回地复制文件。
这里给大家介绍一下 crazy-springcloud 脚手架开发和自验证环境的准备,主要涉及两个方面:
(1)中间件(含 Eureka、Redis、MySQL 等)相关信息的环境变量的配置。
(2)主机名称的配置。
对于中间件相关信息(如 IP 地址、端口、用户账号等),很多项目都是直接以明文编码的方式存放在配置文件中,这样存在安全隐患甚至会引发泄密的风险。对于这些信息,建议通过操作系统环境变量进行配置,然后在配置文件中使用环境变量而不是明文编码。
例如,可以对 Eureka 的 IP 提前配置好环境变量 EUREKA_ZONE_HOST,然后在应用的配置文件 bootstrap.yml 中按照如下方式来使用:
在上面的配置中,通过 ${SCAFFOLD_EUREKA_ZONE_HOSTS}表达式从环境变量中获取 Eureka 的 service-url 地址。环境变量 SCAFFOLD_EUREKA_ZONE_HOSTS 后面跟着一个冒号和一个默认值,表示如果环境变量值为空,就会使用默认值 http://localhost:7777/eureka/作为配置项的值。
通过环境变量配置中间件的信息有什么好处呢?
一是使配置信息的切换多了一层灵活性,如果切换 IP,那么只需修改环境变量即可;二是可以不用在配置文件中以明文编码方式存放密码之类的敏感信息,多了一层安全性。
crazy-springcloud 微服务开发脚手架用到的环境变量较多,以自验证环境 CentOS 中的配置文件/etc/profile 为例,部分内容大致如下:
以上环境变量中的 192.168.233.128 是笔者自验证环境 CentOS 虚拟机的 IP 地址,Redis、ZooKeeper、Eureka、MySQL、Nginx 等中间件都运行在这台虚拟机上,大家在运行 crazy-springcloud 微服务开发脚手架之前需要进行相应的更改。
最后介绍一下有关主机名称的配置。如果在调试过程中直接通过 IP 访问 REST 接口,那么在 Fiddler 工具抓包中查看报文就不方便。为了方便抓包,将 IP 地址都映射成主机名称。在笔者使用的 Windows 开发环境中,hosts 文件内配置的主机名称如下:
注意,本书后文的演示用例用到的 URL 会使用以上主机名称取代 IP 地址。
使用 Fiddler 工具抓包和查看报文
在微服务程序开发和验证的过程中,一般来说对 HTTP 接口发起请求有多种方式:
(1)直接发起请求。
(2)通过内部网关代理(如 Zuul)发起请求。
(3)通过外部网关反向代理(如 Nginx)发起请求。
以 crazy-springcloud 脚手架中的 uaa-provider 服务的 HTTP 接口/api/user/detail/v1 为例,通过以上 3 种方式发起请求的 HTTP 链路示意图如图 1-2 所示。
图 1-2 3 种方式请求 uaa-provider 的 HTTP 链路示意图
在生产环境下,为了满足内外网之间的转发、多服务器之间的负载均衡要求,外部反向代理(Nginx)往往不止一层。因此,请求的 HTTP 链路往往更加复杂。
无论是在开发环境、自验证环境、测试环境还是在生产环境中,查看 HTTP 接口的访问链路和报文内容对于定位、分析、解决问题来说都非常重要,这就需要使用抓包工具。抓包工具的类型比较多,笔者目前使用较多的为 Fiddler。
比如,在调试本书 crazy-springcloud 脚手架中的 uaa-provider 功能时,使用 Fiddler 能全面地查看发往服务端的 HTTP 报文的请求头和响应头,如图 1-3 所示。
图 1-3 使用 Fiddler 查看请求头和响应头
在开发过程中,Fiddler 这类抓包工具的使用对于分析和定位问题非常有用。笔者经常使用 Fiddler 完成下面的工作:
(1)查看 REST 接口的处理时间,在解决性能问题时帮助查看接口的整体时间。
(2)查看 REST 接口的请求头、响应头、响应内容,主要用于查看请求 URL、请求头、响应头是否正确,并且在必要的时候可以将所有请求头一次性地复制到 Postman 等请求发起工具,帮助新请求快速地构造同样的 HTTP 头部。
(3)请求重发,除了可以使用独立的请求工具(如 SwaggerUI/Postman 等)重发请求之外,还可以在 Fiddler 中直接进行请求重发,重发的请求有相同的头部和参数,调试时非常方便。
crazy-springcloud 微服务开发脚手架
无论是单体应用还是分布式应用,如果从零开始开发,那么都会涉及很多基础性的、重复性的工作,比如用户认证、Session 管理等。
有了开发脚手架,这些基础工作就可以省去,直接利用脚手架提供的基础模块,然后按照脚手架的规范进行业务模块的开发即可。
笔者在开源平台看到过不少开源的脚手架,但是发现这些脚手架很少可以直接拿来进行业务模块的开发,要么封装过于重量级而不好解耦,要么业务模块分包不清晰而不方便开发,所以本着简洁和清晰的原则,笔者发起的疯狂创客圈社群推出了自己的微服务开发脚手架 crazy-springcloud,它的模块和功能如下:
在业务模块如何分包的问题上,大部分企业都有自己的统一规范。crazy-springcloud 脚手架从职责清晰、方便维护、能快速导航代码的角度出发,将每一个业务模块细分成以下 3 个子模块。
(1){module}-api:该子模块定义了一些公共的 Constants 业务常量和 DTO 传输对象,既被业务模块内部依赖,又可能被依赖该业务模块的外部模块所依赖。
(2){module}-client:该子模块定义了一些被外部模块所依赖的 Feign 远程调用客户类,是专供给外部模块的依赖,不能被内部的其他子模块所依赖。
(3){module}-provider:该子模块是整个业务模块的核心,也是一个能够独立启动、运行的服务提供者(Application)。该模块包含涉及业务逻辑的 controller 层、service 层、dao 层的完整代码实现。
crazy-springcloud 微服务开发脚手架在以下两方面进行了弱化:
(1)在部署方面对容器的介绍进行了弱化,没有使用 Docker 容器而是使用 Shell 脚本。这有多方面的原因:一是本脚手架的目的是学习,使用 Shell 脚本而不是 Docker 去部署,方便大家学习 Shell 命令和脚本;二是 Java 和 Docker 其实整合得很好,学习起来非常容易,稍加配置就能做到一键发布,找点资料学习一下就可以轻松掌握;三是部署和运维是一项专门的工作,生产环境的部署,甚至是整个自动化构建和部署的工作实际上是属于运维的专项工作,由专门的运维人员去完成,而部署的核心仍然是 Shell 脚本,所以对于开发人员来说掌握 Shell 脚本才是重中之重。
(2)对监控软件的介绍进行了弱化。本书没有专门介绍链路监控、JVM 性能指标、熔断器监控软件的使用,这也有多方面的原因:一是监控软件太多,如果介绍得太全,篇幅就不够,介绍得太少,大家又不一定会用到;二是监控软件的使用大多是一些软件的操作步骤和说明,原理性的内容比较少,传播这类知识使用视频的形式比文字的形式效果更好。疯狂创客圈后续可能会推出一些微服务监控方面的教学视频供大家参考,请大家关注社群博客。无论如何,只要掌握了 Spring Cloud 的核心原理,那么掌握监控组件的使用对大家来说基本上就是小菜一碟。
以秒杀作为 Spring Cloud+Nginx 的实战案例
本文的综合性实战案例是实现一个高性能的秒杀系统。为何要以秒杀作为本书的综合性实战案例呢?先回顾一下在单体架构还是主流的年代,大家学习 J2EE 技术时的综合性实战案例。一般来说,都是从 0 开始编写代码,一行一行地编写一个购物车应用。通过编写购物车应用能对 J2EE 有一个全方位的练习,包括前端的 HTML 网页、JavaScript 脚本,后端的 MVC 框架、数据库、事务、多线程等各种技术。
时代在变,技术的复杂度在变,前端和后端的分工也变了。现在的 J2EE 开发已经进入分布式微服务架构的时代,前端和后端框架都变得非常复杂,前端和后端工程师已经有比较明确的分工。后端程序员专门做 Java 开发,前端程序员专门做前端的开发。后端程序员可以不需要懂前端的技术,如 Vue、TypeScript 等,当然,很多前端程序员也不一定需要懂后端技术。
相比单体服务时代,现在的分布式开发时代学习 Java 后端技术的难度大多了。首先面临一大堆分布式、高性能中间件的学习,比如 Netty、ZooKeeper、RabbitMQ、Spring Cloud、Redis 等都是当今后端程序员必知必会的。然后像 JMeter 这类压力测试工具和 Fiddler 这类抓包工具,已经成为每个后端程序员必须掌握的知识。因为在分布式环境下需要定位、发现并解决数据一致性、高可靠性等问题,通过压力测试,本来很正常的代码也会在运行时出现很多性能相关的问题。
另外,随着移动互联网、物联网的发展,当前面临的高并发场景已经不局限于电商,在其他的应用中也越来越多。所以,现在高并发开发技术由少数工程师需要掌握的高精尖技术变成了大多数人都需要掌握的基础技能。一般来说,高并发开发的三大利器为缓存、降级和限流。缓存的目的是提高系统访问速度,它是对抗高并发的银弹;而降级是当服务出问题或者服务影响到核心流程时,可以将服务暂时屏蔽掉,待高峰或者问题解决后再打开;而有些场景并不能用缓存和降级来解决,比如稀缺资源(秒杀、抢购)、写数据(如评论、下单)等,这种情况下可以使用限流措施来对接口进行保护。
有了缓存、降级和限流这三大利器,遇到像京东 618、阿里双 11 这样的高并发应用场景,才不用担心瞬间流量导致系统雪崩,哪怕是最终只能做到有损的服务,也不会出现某些小电商平台在活动期间服务器宕机数小时的事故。
秒杀程序的业务足够简单,涉及的技术又足够全面,可以说是分布式应用场景非常好的实战案例。另外,现在 IT 行业人才流动性比较大,大家都会为面试做准备。在面试中,秒杀业务所覆盖的缓存、降级、高并发限流、分布式锁、分布式 ID、数据一致性等问题一般是重点、热门问题。
本文给大家讲解的内容是 Spring Cloud+Nginx 架构的主要组件
下篇文章给大家讲解的是 Spring Cloud 入门实战;
觉得文章不错的朋友可以转发此文关注小编;
感谢大家的支持!
版权声明: 本文为 InfoQ 作者【小Q】的原创文章。
原文链接:【http://xie.infoq.cn/article/d9ccc92d2a774cb00c2108e02】。
本文遵守【CC BY-NC-ND】协议,转载请保留原文出处及本版权声明。
评论