基于阿里云服务网格流量泳道的全链路流量管理(三):无侵入式的宽松模式泳道
作者:尹航
在前文《基于阿里云服务网格流量泳道的全链路流量管理(一):严格模式流量泳道》、《基于阿里云服务网格流量泳道的全链路流量管理(二):宽松模式流量泳道》中,我们介绍了流量泳道的概念、使用流量泳道进行全链路灰度管理的方案,以及阿里云服务网格 ASM 提供的严格模式与宽松模式的流量泳道。在本文中,我们将介绍一种基于 OpenTelemetry 自动插装方案实现的宽松模式流量泳道场景,无需任何业务代码改造即可为运行在 Kubernetes 集群中的云原生应用实现灵活的全链路灰度管理能力。
概述
流量泳道是将一个云原生应用中的多个服务根据服务版本(或其他特征)隔离成的多个独立的运行环境。
在严格模式下,每条流量泳道中包含应用的调用链路上的全部服务,对于应用程序则没有任何要求。
而在宽松模式下,您只需要确保创建一条包含调用链路中所有服务的泳道:基线泳道。其它泳道可以不包含调用链路上的全部服务。当一个泳道中的服务进行相互调用时,若目标服务在当前泳道中不存在,则请求将被转发到基线泳道中的相同服务,并在请求目标存在当前泳道中存在时将请求重新转发回当前泳道。宽松模式的流量泳道虽然可以实现灵活的全链路灰度,但要求应用程序必须包含一个能够在整条调用链路中透传的请求头(链路透传请求头)。
阿里云服务网格 ASM 已经提供一种基于 baggage 透传的全新宽松模式流量泳道方案,能够在不改造业务代码的情况下,实现泳道服务的灵活灰度。
背景介绍
OpenTelemetry 是云原生计算基金会(Cloud Native Computing Foundation, CNCF)的一个项目,与其他 CNCF 项目如 Kubernetes、Prometheus 和 Envoy 等紧密相连,共同构建了云原生技术生态系统的基础。由于其提供的丰富功能和广泛适用性,OpenTelemetry 在业内已经确立了其领导地位,越来越多的企业和开发者采用它作为构建和维护可观测性平台的核心组件。
baggage 是由 OpenTelemetry 制定并推动的、在分布式系统调用链路中传递链路上下文信息的标准。它具体表现为一个名为 baggage 的请求头,其内部包含了以键值对形式存储的链路上下文信息,例如:
您可以使用 OpenTelemetry 提供的 SDK,在服务调用链路中传递 baggage 请求头、进而在整条服务链路上传递自定义的上下文信息。当服务部署在 Kubernentes 集群中时,则可以通过 OpenTelemetry Operator 的自动插装来为服务提供 baggage 透传能力、而无需修改业务代码。有关 baggage 的详细信息,可以参考 baggage [ 1] 。
基于 baggage 的透传,阿里云服务网格 ASM 提供了一种无需修改代码即可实现的宽松模式流量泳道,并针对流量泳道的引流策略进行了增强,支持基于流量权重策略对不同的泳道进行引流。本文将首先使用 OpenTelemetry 自动插装来为服务引用透传 baggage 请求头的能力,接下来创建宽松模式下的三条泳道,并基于流量权重策略对不同的泳道进行引流。
演示:实现服务 baggage 透传与宽松模式流量泳道
前提条件
已创建 ASM 企业版或旗舰版实例,且版本为 1.21.6.54 及以上。具体操作,请参见创建 ASM 实例 [ 2] 。
已添加集群到 ASM 实例。具体操作,请参见添加集群到 ASM 实例 [ 3] 。
已创建名称为 ingressgateway 的 ASM 网关。具体操作,请参见创建入口网关服务 [ 4] 。
已创建名称为 ingressgateway 且命名空间为 istio-system 的网关规则。具体操作,请参见管理网关规则 [ 5] 。
步骤一:配置服务透传 baggage 上下文
本节主要展示如何通过 OpenTelemetry Operator 自动插装的方法,为 Kubernetes 集群中的服务添加 baggage 透传能力。
部署 OpenTelemetry Operator。
a. 通过 kubectl 连接到 ASM 实例添加的 Kubernetes 集群。执行以下命令,创建 opentelemetry-operator-system 命名空间。
b. 执行以下命令,使用 Helm 在 opentelemetry-operator-system 命名空间下安装 OpenTelemetry Operator。(如果尚未安装 Helm,可以参考安装 Helm 来安装 Helm 命令行工具。)
c. 执行以下命令,检查 opentelemetry-operator 是否正常运行。
预期输出:
配置自动插装(auto-instrumentation)。
a. 使用以下内容,创建 instrumentation.yaml 文件。
b. 执行以下命令,在 default 命名空间下声明自动插装。
🔔 说明: 对于 OpenTelemetry 框架来说,其最佳实践还包括部署 OpenTelemetry Collector 以收集可观测数据。由于本文主要演示 OpenTelemetry 自动插装实现的 baggage 链路透传,因此没有包含部署 OpenTelemetry Collector 的步骤。
步骤二:部署示例服务
为 default 命名空间启用 Siedcar 网格代理自动注入。具体操作,请参见开启 Sidecar 自动注入 [ 6] 。
关于自动注入的更多信息,请参见配置 Sidecar 注入策略。
使用以下内容,创建 mock.yaml 文件。
对于每个实例服务 Pod,都加入了 instrumentation.opentelemetry.io/inject-java: "true"和 instrumentation.opentelemetry.io/container-names: "default"两个注解,以声明该实例服务使用 java 语言实现,并要求 OpenTelemetry Operator 对名称为 default 的容器进行自动插装。
执行以下指令,部署实例服务。
基于 OpenTelemetry 自动插装机制,部署的服务 Pod 将自动具有在调用链路中传递 baggage 的能力。
步骤三:创建泳道组和对应泳道
创建泳道组。
a. 登录 ASM 控制台 [ 7] ,在左侧导航栏,选择服务网格 > 网格管理。
b. 在网格管理页面,单击目标实例名称,然后在左侧导航栏,选择流量管理中心 > 流量泳道。
c. 在流量泳道页面,单击创建泳道组,在创建泳道组面板,配置相关信息,然后单击确定。
创建 s1、s2、s3 泳道,并分别绑定 v1、v2、v3 版本。
a. 在流量泳道页面的流量规则定义区域,单击创建泳道。
b. 在创建泳道对话框,配置相关信息,然后单击确定。
创建 s1 泳道的示例图如下:
三个泳道创建完成后,示例效果如下。默认情况下,您在泳道组中创建的第一个泳道将被设定为基线泳道。您也可以修改基线泳道,当流量发往其它泳道中不存在的服务时,通过回退机制将请求转发至基线泳道。关于修改基线泳道的具体操作,请参见修改基线泳道 [ 8] 。
三个泳道创建完成后,针对泳道组中的每个服务都将生成泳道规则对应的目标规则 DestinationRule 和虚拟服务 VirtualService。您可以在控制台左侧导航栏,选择流量管理中心 > 目标规则或虚拟服务进行查看。例如,针对 mocka 服务会自动创建如下 DestinationRule 和 VirtualService。
创建基于权重的统一引流规则。
a. 在流量泳道页面的流量规则定义区域,单击引流策略中的基于权重引流。
b. 在设定统一引流规则对话框,配置相关信息,然后单击确定。本文以泳道服务对应入口 API 为 /mock 为例,为三条泳道配置统一的引流规则。
设定统一引流规则的示例图如下:
设定三条泳道的引流权重,引流权重确定了流量向每条泳道发送的比例。
a. 在流量泳道页面的流量规则定义区域,在每条泳道的引流权重列,单击数字右侧的
按钮,在编辑引流权重对话框,配置相关信息,然后单击确定。
编辑流量权重的示例图如下:
步骤四:验证全链路灰度功能是否生效
获取 ASM 网关的公网 IP。具体操作,请参见获取 ASM 网关地址 [ 9] 。
执行以下命令,设置环境变量。xxx.xxx.xxx.xxx 为上一步获取的 IP。
验证全链路灰度功能是否生效。
a. 执行以下命令,查看三条泳道的访问效果。
预期输出:
由预期输出得到,流量将以约 6:2:2 的比例发送到 s1、s2、s3 泳道,并由 s1 作为基线泳道,当调用链路中不存在某个服务的特定版本时,将会调用 s1 泳道中的对应服务。
总结
本文简要讨论了使用流量泳道来实现全链路流量灰度管理的场景与方案,并回顾了阿里云服务网格 ASM 提供的严格与宽松两种模式的流量泳道、以及这两种模式各自的优势与挑战。接下来介绍了一种基于 OpenTelemetry 社区提出的 baggage 透传能力实现的无侵入式的宽松模式泳道,这种类型的流量泳道同时具有对业务代码侵入性低、同时保持宽松模式的灵活特性的特点。同时,我们还介绍了新的基于权重的流量引流策略,这种策略可以基于统一的流量匹配规则,将匹配到的流量以设定好的比例分发到不同的流量泳道。
相关链接:
[1] baggage
https://opentelemetry.io/docs/concepts/signals/baggage/
[2] 创建 ASM 实例
https://help.aliyun.com/document_detail/147793.html#task-2370657
[3] 添加集群到 ASM 实例
https://help.aliyun.com/document_detail/148231.html#task-2372122
[4] 创建入口网关服务
https://help.aliyun.com/document_detail/150510.html#task-2372970
[5] 管理网关规则
https://help.aliyun.com/document_detail/150504.html
[6] 开启 Sidecar 自动注入
https://help.aliyun.com/document_detail/186136.html#task-1962690
[7] ASM 控制台
https://servicemesh.console.aliyun.com/
[8] 修改基线泳道
[9] 获取 ASM 网关地址
https://help.aliyun.com/document_detail/444079.html#section-ida-zt6-md7
版权声明: 本文为 InfoQ 作者【阿里巴巴云原生】的原创文章。
原文链接:【http://xie.infoq.cn/article/cf1fada89f344613dac050ce9】。文章转载请联系作者。
评论