ONE 2.0 应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?
近年来,随着数字化转型的不断推进,电子商务发展迅速,推动人们的购物行为随之发生转变,在线购物已成为人们的主要购物方式之一。相关数据表明,超过九成的中国网民使用过在线购物平台。
面对庞大的在线用户流量,购物网站的业务规模和复杂程度不断提升,维护系统稳定性的重要程度和难度也随之增大。当故障问题产生时,如何直观地还原故障传导链路,快速定位和解决问题,就成为了重中之重。
Bonree ONE 2.0 设计的初衷,便是将所有运维诉求“ALL in ONE”,让 IT 运营更智能、让业务创新更高效、让问题解决更快速。对于客户来说,开箱即用、操作便捷,使用第一个功能可以解决的问题就不需要再点击第二个功能。
四大场景提升网站应用性能与用户体验
一、用户登录网站购物时遇到问题,如何进行故障定位
Bonree One 2.0 可深度还原故障场景,并将其转化为为 IT 语言,通过查看前端问题,关联整体调用链,展示调用链树和代码,快速定位故障,找到缓慢代码,助力快速解决问题。
操作步骤
步骤一:该购物网站登录、搜索产品、选择产品、付费、登出的全过程;
步骤二:在 Bonree ONE 2.0 平台中找到该次用户会话,还原使用过程,查看后端缓慢问题;
步骤三:跳转到调用链,展示调用链树,展示调用架构,找到缓慢的代码调用的耗时分析、错误、日志等;
步骤四:通过端到端的能力,反向查找用户会话。
二、主动模拟故障发生场景,进行智能告警与根因分析
Bonree ONE 2.0 的智能告警可以做到真正意义上告知用户问题及根因,同时依赖独家根因智能算法和模型,不依赖人工调参,无监督自动学习;也可接受人工结果反馈,自动修正模型提高结果准确性,实现低成本、高灵活度、高准确性的智能根因分析能力。
操作步骤
步骤一:在故障中找到智能根因分析产生的告警信息,展示告警信息的内容;
步骤二:展示根因分析结果,与模拟的故障相符;
步骤三:通过根因回放,呈现故障产生的过程。
三、用户访问量下降,监测后端服务响应时间是否异常
面对用户访问量下降、访问异常等情况,Bonree ONE 2.0 可对后端服务响应时间进行监测,以此诊断系统是否存在故障,助力快速排障。
操作步骤
步骤一:查看过去一段时间的用户访问量,并做同期对比,发现访问量下降;
步骤二:分析用户访问量下降的原因,同时发现用户访问缓慢;
步骤三:利用数据分析模块,将与用户访问量相关的指标(如后端服务响应时间等)进行对比分析,发现随着服务响应时间变长,用户访问量下降;
步骤四:点击服务响应时间峰值点,查看相关调用链,发现数据库该时间段访问缓慢,查找数据访问缓慢原因,如某项 SQL 语句逻辑有问题;
步骤五、问题解决后,用户访问量恢复。
四、监控面板功能与流程
操作步骤
步骤一:通过仪表盘,展示关键指标,以及仪表盘的筛选、刷新、轮播等功能;
步骤二:仪表盘出现告警的处理流程,如关联用户会话、调用链,进行诊断。
Bonree ONE 2.0 凭借稳健的技术底盘和强大的中台能力,支撑了多个应用场景,不仅覆盖了 IT 运维监控,还做到了向左支持敏捷开发,向右支撑业务运营,形成了真正的一体化智能可观测平台。
评论