写点什么

观测云产品更新|新增智能巡检功能;新增用户访问指标检测事件通知模板变量等

作者:观测云
  • 2022 年 7 月 22 日
  • 本文字数:1851 字

    阅读完需:约 6 分钟

观测云产品更新|新增智能巡检功能;新增用户访问指标检测事件通知模板变量等

观测云更新

新增智能巡检功能

智能巡检基于观测云的智能检测算法,支持自动检测基础设施和应用程序问题,帮助用户发现 IT 系统运行过程中发生的问题,通过根因分析,快速定位异常问题原因;通过观测云的智能预测算法,帮助用户提前预见基础设施和应用程序的潜在问题,评估问题对系统运行的影响等级,更好的确定排障工作的优先级,减少排障过程的不确定性。


智能巡检目前支持三种巡检模板:


  • 内存泄漏:检测当前工作空间主机是否存在内存泄漏问题

  • 磁盘使用率:检测当前工作空间主机的磁盘是否存在使用率过高问题

  • 应用性能检测:检测当前工作空间服务 QPS、平均响应时间、P90 响应时间以及错误率是否存在波动变化



优化查看器搜索和筛选功能

1.查看器搜索新增「not wildcard 反向模糊匹配」,即不匹配模糊查询结果。



2.查看器快捷筛选新增空间级和个人级筛选方式


  • 空间级筛选项:由管理员/拥有者进行配置,点击快捷筛选旁的「设置」按钮,即可配置空间级筛选项

  • 个人级筛选项:所有成员都可以配置基于 「个人+浏览器」的快捷筛选项,点击快捷筛选右侧的「编辑」,即可配置个人级筛选项


更多详情可参考文档【 查看器的搜索和筛选 】https://docs.guance.com/getting-started/necessary-for-beginners/explorer-search/



新增修改 URL 中的时间范围进行数据查询

观测云支持在浏览器的 URL 中直接修改当前工作空间查看器/仪表板的 time 参数的时间范围进行数据查询,支持秒、分、时、天 4 种单位,如 time=30s、time=20m、time=6h、time=2d 等,如下图所示在浏览器修改 time=2h ,查看器展示最近 2 小时的数据。


更多详情可参考文档【 URL 的时间范围 】https://docs.guance.com/getting-started/necessary-for-beginners/explorer-search/#url



新增仪表板视图变量日志、应用性能、用户访问、安全巡检数据来源配置

仪表板视图变量新增「日志」、「应用性能」、「用户访问」、「安全巡检」数据来源配置,同时优化仪表板新建和编辑视图变量的交互。


  • 在未添加过视图变量的仪表板,顶部导航栏增加「添加视图变量」按钮,点击即可添加视图变量

  • 若仪表板已添加过视图变量,顶部导航栏下面会直接显示视图变量名称,点击右侧「编辑」按钮,即可进入视图变量编辑页面


更多详情可查看文档【 视图变量 】https://docs.guance.com/scene/view-variable/



优化图表查询交互

  • 点击图表和查询中间的「分隔条」即可上下拖动

  • 点击查询语句左侧的「拖拽」按钮,上下拖动即可调整查询的顺序

  • 滚动条仅作用于查询语句区域,不影响图表



新增用户访问指标检测事件通知模板变量

在「用户访问指标检测(RUM)」监控器中配置通知事件,除了通用的模板变量外,额外支持下列模板变量。


更多详情可参考文档【 事件标题|内容模版 】https://docs.guance.com/monitoring/event-template/



优化事件内容一键打开链接

配置监控器时,在事件内容添加链接,当触发事件后,在事件详情页的「事件内容」,点击链接即可打开新页跳转页面。


DataKit 更新

  • prom 采集器的内置超时时长为 3 秒

  • 日志相关问题修复:

    添加日志采集的 log_read_offset 字段

    修复日志文件在 rotate 后没有正确 readAll 的 bug

  • 容器采集相关问题修复:

    修复对环境变量 NODE_NAME 的不兼容问题

    k8s 自动发现的 prom 采集器改为串行式的、node 分散采集

    添加日志 source 和多行的的映射配置

    修复容器日志替换 source 后还使用之前的 multiline 和 pipeline 的 bug

    修正容器日志,设置文件活跃时长是 12 小时

    优化 docker 容器日志的 image 字段

    优化 k8s pod 对象的 host 字段

    修复容器指标和对象采集没有添加 host tag 的问题

  • eBPF 相关:

    修复 uprobe event name 命名冲突问题

    增加更多环境变量配置,便于云 k8s 环境的部署

  • 优化 APM 数据接收接口的数据处理,缓解卡死客户端以及内存占用问题

  • SQLServer 采集器修复:

    恢复 TLS1.0 支持

    支持通过 instance 采集过滤,以减少时间线消耗

  • Pipeline 函数 adjust_timezone() 有所调整

  • IO 模块优化,提高整体数据处理能力,保持内存消耗的相对可控

  • Monitor 更新:

    修复繁忙时 Monitor 可能导致的长时间卡顿

    优化 Monitor 展示,增加 IO 模块的信息展示,便于用于调整 IO 模块参数

  • 修复 Redis 奔溃问题

  • 去掉部分繁杂的冗余日志

  • 修复选举类采集器在非选举模式下不追加主机 tag 的问题


更多 DataKit 更新可参考【 DataKit 版本历史 】https://docs.guance.com/datakit/changelog


最佳实践更新

  • 云平台接入

    Rancher 部署 DataKit 最佳实践

    腾讯云产品可观测最佳实践 (Function)


更多最佳实践更新可参考【 最佳实践版本历史 】https://docs.guance.com/best-practices/index

用户头像

观测云

关注

还未添加个人签名 2021.02.08 加入

云时代的系统可观测平台

评论

发布
暂无评论
观测云产品更新|新增智能巡检功能;新增用户访问指标检测事件通知模板变量等_观测云_InfoQ写作社区