写点什么

观测云产品更新 | 异常追踪、数据保存策略、BPF 日志、管理优化等

作者:观测云
  • 2024-08-22
    上海
  • 本文字数:1703 字

    阅读完需:约 6 分钟

观测云产品更新 | 异常追踪、数据保存策略、BPF 日志、管理优化等

观测云更新

Breaking Changes

  • OpenAPI:【事件】未恢复事件数据源从 UE 变更为 E 。

新增功能

  • 管理:新增 Client Token 统一管理入口,用户使用公网 DataWay 接入 RUM 应用时,可更换系统默认生成的 Token,使用自定义创建的 Token。



持续优化

异常追踪

  • 新增 Issue 发现页面。通过这一功能,您可以定制 Issue 发现的具体规则,对监控器检测规则触发的异常事件和相关数据进行统一管理和筛选。将一系列事件视为由单一原因引起,并为这些事件设置筛选条件,然后选择聚合维度来进一步细化数据。细化后,数据会根据您设定的检测频率进行聚合。最终,系统会根据您预设的 Issue 标题和描述,自动将这些信息推送到指定的频道,确保所有相关方都能及时接收并有效处理这些 Issue。



  • 配置管理 > 通知策略:通知策略列表新增创建/更新的信息显示。

常规更新

数据保存策略

  • 原【应用性能】项拆分为【应用性能-链路】、【应用性能-Profile】,支持用户分别配置 Trace 数据和 Profile 数据的保存策略;

  • 原【数据转发】名称修改为【数据转发-观测云】。

未恢复事件查看器

  • 数据源变更为查询事件数据,以 df_fault_id 作为唯一标识进行聚合,获取最近一条数据结果返回展示。

  • 页面整体 UI 改造。



应用性能监测(APM) > 链路

  • 服务调用关系图新增绑定内置视图能力,点击服务的卡片,即可快速查看与该服务关联的相关用户视图。

管理

  • 新增【工作空间描述】;

  • 编辑模式下,交互变更为打开新窗口;

  • 工作空间列表下支持通过工作空间的名称或描述来搜索定位。

日志

  • 日志 > BPF 日志 > 七层 BPF 网络日志:网络请求拓扑图 UI 优化,突出了服务端与客户端的区分。

可用性监测

  • 可用性监测 > HTTP 监测 > 高级设置 > 请求设置默认添加 Accept-Encoding:identity 。

BUG 修复

  • 解决异常追踪的通知策略未生效的问题;

  • 解决应用性能监测链路追踪导出异常的问题;

  • 解决通过 openAPI 修改通知对象报错无权限配置显示的问题;

  • 解决日志查看器重新设置时间范围后不能自动获取 source 筛选的问题;

  • 解决查看器搜索栏已添加 source 筛选条件范围,但在快捷筛选中依旧显示过滤条件外的全部 source 的问题;

  • 解决突变检测报错的问题;

  • 解决通过 OpenAPI 写入数据访问规则后,UI 页面打开无法查看角色信息的问题;

  • 解决图表设置的数据格式对图例中数据不生效的问题;

  • 解决自建拨测节点下,关联的拨测任务删除后,实际拨测还在运行的问题。

部署版更新

1、新增拨测节点管理入口,支持创建平台级别拨测节点,并通过节点列表统一管理所有节点。通过此入口创建的拨测节点支持配置中英文节点名,从而适配观测云的国内外站点显示和上报数据结果内容。



2、数据保存策略

  • 考虑到用户处于存储成本等因素的考量,需要自定义这些数据的保存时长,部署版管理后台新增【会话重放】配置项。

  • 原【数据转发】名称修改为【数据转发-默认存储】;

  • 原【应用性能】项拆分为【应用性能-链路】、【应用性能-Profile】,支持用户分别配置 Trace 数据和 Profile 数据的保存策略;

3、支持火山引擎 TLS 做为底层数据存储引擎。

DataKit 更新

新加功能

  • 新增 Pipeline 函数 pt_kvs_setpt_kvs_getpt_kvs_delpt_kvs_keys 以及 hash

  • 拨测采集器支持自定义标签和节点英文名称

问题修复

  • 修复 eBPF 采集器内存泄漏问题

  • 修复 Kubernetes Events 在接受 Deleted 数据导致采集重复的问题

  • 修复 KubernetesPrometheus 采集器在 Service/Endpoints 的 target 标签未找到问题注意,此处需更新 datakit.yaml

功能优化

  • Oracle 采集器慢日志时间过滤条件优化

  • PostgreSQL 采集器指标 postgresql_size 采集方式优化

  • 完善拨测调试接口的返回信息

  • 优化 Pipeline 对日志类数据的 status 字段的处理问题,新版本已支持任何自定义的日志等级

  • BPF 网络日志新增标识客户端、服务端 IP 和端口以及连接侧的相关字段

  • TCP Socket 日志采集支持多行配置

  • Kubernetes 部署时,如果有同名 Node,支持通过增加前/后缀来区别 host 字段的取值

  • 采集器上报数据时,默认改成全局阻塞模式,以缓解(注意只能缓解,不能避免)时序数据因队列阻塞而丢失的问题调整了 monitor 部分信息的展示,1)会展示采集器上报数据的阻塞时长(P90);2)展示每个采集器的单次采集点数(P90),以更明显的展示出具体某个采集器的采集量。

用户头像

观测云

关注

还未添加个人签名 2021-02-08 加入

云时代的系统可观测平台

评论

发布
暂无评论
观测云产品更新 | 异常追踪、数据保存策略、BPF 日志、管理优化等_产品迭代_观测云_InfoQ写作社区