SRE 与开发的自动化协同 -- 生产环境出现 bug 自动生成异常追踪
简介
生产环境 bug 的定义:RUM 应用和 APM 应用的 error_stack 信息被捕捉后成为 bug。以 APM 新增错误巡检为例,当出现新错误时,在观测云控制台的「事件」模块下生成新的事件报告,捕捉为 bug。同时利用 Dataflux Func 创建异常追踪,调用观测云 OpenAPI ,在观测云控制台的「异常追踪」模块下新建 Issue,当重复出现 bug,合并至已有异常追踪。
实现流程
1.在观测云新建一个应用
根据接入的应用类型可分别查看对应文档
2.在 Dataflux Func 中安装 APM 新增错误脚本或 RUM 新增错误脚本。
3.根据 OpenAPI 接口在巡检 example 脚本中添加创建 issue 动作示例代码如下:
4.查看观测云控制台的「异常追踪」模块,可看到:
总结
对于智能巡检的所有脚本,都可以在生成事件报告时新建 issue。但因为在事件列表和异常追踪列表有重复的信息上报,所以往往不会有新建 issue 的动作。利用本篇最佳实践,用户可根据创建的 issue 在异常追踪列表对巡检事件进行修复跟踪,不需要再单独到事件列表寻找独立上报的事件进行跟踪。
评论