窥探 Tomcat 整体架构,server
如上图 server.xml 配置,最外层是一个 Server,代表 Tomcat 的运行实例。Server 里有一些监听器 Listener,一个不知道干啥的 GlobalNamingResources,还有一个 Service,通过阅读源码,发现一个 Server 里可以有多个 Service。
Service 可以理解为是对部署在 Tomcat 里的服务的抽象,一个 Tomcat 可以部署多个服务,但是我更喜欢把一个 Service 理解成一个服务集合或者集群。
Service 里有一个 Executor、Connector 和 Engine。Executor 是一个线程池,可以供 Contector 使用;Connector 定义了协议连接(HTTP/AJP),外界就是通过 Connector 访问 Service 里的服务的;Engine 是容器引擎,可以理解它为 Servlet 容器,真正的业务处理在 Engine 里。通过阅读源码,一个 Service 可以有多个 Executor,多个 Connector,一个 Engine。如果把 Service 比作一个房子,Connector 比作门,一个房子可以有多个门就好理解了。
Engine 内部较复杂,它内部就像俄罗斯套娃,有多个子容器,子容器下又可以有多个子容器。正如 Engine 的英文含义,引擎,驱动和管理内部子容器。因为是最顶端的管理者,会包含一些组件辅助管理子容器。Engine 可以有多个 Host 容器,可以理解为虚拟主机(URL 地址中主机部分抽象);Host 容器里有多个 Context 容器,Context 就是一个个 Web 应用;Context 容器里有多个 Wrapper 容器,server.xml 中一般不用配置,Wrapper 是对 Servlet 的包装,就是一个个业务功能了。
如果对应上 Service 房子的比喻,Engine 可以比作房子里所有房间的总和,或者是通向每个房间的走道,Host 就是一个个房间,房间里有一些家具家电(Context),每一个家具家电有很多功能(Wrapper)。
二、Tomcat 运行实例 Server
==================
Server 是 Tomcat 运行实例的抽象,管理着内部多个服务。在 Tomcat 源码中 Server 的默认标准实现是
org.apache.catalina.core.StandardServer:
默认有 6 个生命周期监听器,监听 Server 不同运行阶段的事件并作出响应。
GlobalNamingResources 全局命名资源,通过 JNDI 提供统一的命名对象访问接口。
Server 监听了一个端口,默认 8005,如果这个端口传来 SHUTDOWN 指令,则关闭 Tomcat。
Server 还有两个定时任务,监听触发一些在 Tomcat 整个生命周期里周期性事件,暂时只有自动部署。
2.1 生命周期监听器
===========
(1)VersionLoggerListener
org.apache.catalina.startup.VersionLoggerListener 监听初始化阶段,输出一些运行日志,如操作系统、JDK、Tomcat 版本信息以及 catalina.base、catalina.home 的定义等。
(2)AprLifecycleListener
Tomcat 可以使用 APR 本地库从操作系统级别解决异步 IO 问题,通过 JNI 方式调用 APR 本地库大幅提高对静态资源的处理性能。
org.apache.catalina.core.AprLifecycleListener 对初始化前的事件和销毁后的事件感兴趣:
在 Tomcat 初始化前,AprLifecycleListener 尝试初始化 APR 库,如果初始化成功,则使用 APR 接收并处理客户端的请求。
在 Tomcat 销毁后,AprLifecycleListener 会对 APR 做一些销毁终止操作。
(3)JreMemoryLeakPreventionListener
org.apache.catalina.core.JreMemoryLeakPreventionListener 监听器会在 Tomcat 初始化时使用系统类加载器预先加载一些 JRE 的类和设置 URLConnection 缓存禁用属性,以避免线程上下文类加载器是 Tomcat 自定义的 Webappclassloader 时,加载 JRE 导致的内存泄漏和 URLConnection 缓存导致的锁文件问题。
(4)GlobalResourcesLifecycleListener
org.apache.catalina.mbeans.GlobalResourcesLifecycleListener 会在 Tomcat 启动时为 JNDI 创建 MBean,停止时销毁 MBean。
(5)ThreadLocalLeakPreventionListener
org.apache.catalina.core.ThreadLocalLeakPreventionListener 监听器监听 Context 停止后,销毁连接器 Connector 中 Executor 的所有核心工作线程,并重新创建,以避免使用 ThreadLocal 带来的内存泄漏。
(6)NamingContextListener
org.apache.catalina.core.NamingContextListener 监听器在 Tomcat 启动时创建并绑定全局命名资源,在 Tomcat 停止前做一些解绑全局命名资源、反注册销毁等操作。
2.2 GlobalNamingResources
=========================
GlobalNamingResources 全局命名资源,通过 JNDI 提供统一的命名对象访问接口。而 JNDI(Java Naming and Directory Interface)是一个比较老旧的技术,在历史遗留的企业级应用中可能还在用,诸如获取一个数据库连接资源、自定义配置等,这种强耦合在启动配置文件里的方式已经不适用现在轻量级的应用和分布式服务了。(后续可以单独研究下,这里了解即可。)
2.3 监听 SHUTDOWN 命令
================
Tomcat 启动时,主线程做完所有启动工作后,会进入循环等待 SHUTDOWN 的状态。如果接收到 SHUTDOWN,结束循环调用 Tomcat 停止销毁接口。
实现方式很简单,单独给主线程建立一个 socket 连接,时刻监听某个端口(默认 8005),是否发来 SHUTDOWN 命令。
2.4 定时触发自动部署周期性事件
=================
Server 启动时,会开启两个定时任务,一个是每 10 秒触发一次自动部署事件,而这个定时任务可能会因为自动部署的检查和部署过程中出现异常导致该定时任务停止,所以就有了另一个定时任务每 1 分钟检查一次自动部署定时任务是否有在正常运行,没有就重新设置。(自动部署是 Host 的工作,在 Host 的生命周期监听器 HostConfig 中监听执行)
三、服务抽象 Service
=============
Service 默认标准实现是
org.apache.catalina.core.StandardService,如果在 Server 中配置了多个 Service,name 必须唯一,不可重复。
Service 包含的组件有 Executor、Connector、Engine,还有一个 Mapper 组件没有在配置中体现,一般也不需要配置。
3.1 共享线程池 Executor
=================
Service 中可以定义一些线程池,供 Connector 和其他组件使用。Tomcat 没有另起炉灶实现自己的线程池,而是在 JUC 的 ThreadPoolExecutor 基础上做了定制化改造,默认标准实现是
org.apache.catalina.core.StandardThreadExecutor。
Executor 可配置项如下:
注意:
如果指定 Executor 的实现是 StandardThreadExecutor,那么 prestartminSpareThreads 无论是 true 还是 false,都会预先创建 minSpareThreads 个核心工作线程。
3.2 连接器 Connector
================
Connector 是 Service 的门户,一个 Service 可以有多个 Connector。Connector 定义了多种连接协议,配置较为复杂,现仅提供常见配置说明:
![窥探 T
omcat 整体架构,server.xml 常用配置解析](https://static001.geekbang.org/infoq/ff/ff78ea976776090f805b7a31f93ee799.png)
注意:
Tomcat10.0.6 中 NioEndpoint 已经不能配置 Poller 线程和 acceptor 线程的个数,默认都是一个,同时 AprEndpoint 也标注为不建议使用,所以关于 APR 的配置也可以不用深入了解。后面会详细研究 Connector 的内部实现,到时讲解其他与源码相关的配置项。
3.3 容器引擎 Engine
==============
Engine 是 Servlet 容器最顶端的管理者,负责处理对应 Service 中所有请求,包含多个 Host 和其他组件。默认标准实现是
org.apache.catalina.core.StandardEngine。Engine 以及其子容器都继承自 ContainerBase,都有些相似的组件,如 AccessLog、Pipeline、Cluster、Realm、Log、LifecycleListener、ContainerListener 等。
Engine、Host、Context 都有一个同名前缀的 LifecycleListener,如 Engine 的是 EngineConfig,Host 的是 HostConfig,Context 是 ContextConfig,分别监听自己感兴趣的生命周期事件,如 EngineConfig 就是在 Engine 启动停止时输出一些日志。
对于 Engine 节点可选配置有如下几个:
注意:
Engine 即其子容器 Host、Context、Wrapper 都可以设置 backgroundProcessorDelay 这个参数,都可以有自己的后台线程来延迟 backgroundProcessorDelay 时长周期性处理一些事情。如果 backgroundProcessorDelay<=0 则不会创建私有的后台线程,默认 Engine 中这个参数是 10,其他子容器是-1,所以一般情况子容器需要后台处理的事情,都交由 Engine 启动的后台线程周期性延迟处理。
上层容器启动停止下层容器时,会用一个线程池来做异步处理。
3.4 URI 映射器 Mapper
================
Service 中 Mapper 组件主要提供给 Connector 和 Context 使用,Connector 中处理完连接后需要将请求信息交给对应的 Host 处理,可以通过 Mapper 的解析找到 Host;Context 通过 Mapper 找到对应的 Servlet(Wrapper)处理业务。
Mapper 还有一个对应的生命周期监听器 MapperListener,其主要监听容器启动后,将容器注册到 Mapper 的关系中,建立一个树状结构。容器停止后做一些销毁、反注册操作。
(详细的 Mapper 原理后面会单独出文章讲解)
四、虚拟主机 Host
==========
Host 是 Engine 的子容器,默认标准实现是
org.apache.catalina.core.StandardHost。它的主要职责就是管理和部署子容器 Context,比如,Host 启动前,预先创建好部署 web 应用的目录;Host 启动时,部署 web 应用;Host 运行过程中,周期性检查 web 应用是否需要自动部署,这些监听工作都是在 HostConfig 中做的。
如下是 Host 的一些常用配置:
4.1 Host 部署 web 应用
===============
Host 部署 web 应用(Context)的三种方式:
Context 描述文件部署,默认是 %CATALINA_BASE%/conf/[EngineName]/[HostName]/目录下,可以有多个 Context 配置,后缀必须为.xml。可以通过 xmlBase 指定 Context 配置文件存放目录。
WAR 包部署,即将 web 应用打包成一个.war 部署,默认放在 %CATALINA_BASE%/webapps 目录下,可以通过 appBase 指定一个绝对路径。
目录部署,默认也是放在 %CATALINA_HOME%/webapps 目录下。
三种部署的过程都是解析实例化 Context,而后两者 web 应用可能有自己的 META-INF/context.xml,则通过解析它来组装生成 Context,否则就解析全局的
%CATALINA_BASE%/conf/context.xml。
五、Web 应用 Context
评论