聊点技术 | 全新功能,让 Bonree ONE 变得更强
4 月 21 日,博睿数据 ONE 有引力 2023 春季产品发布会圆满落幕,Bonree ONE 2023 春季正式版正式发布,带来更轻、更强、更智能的一体化智能可观测平台。
全新功能,让 Bonree ONE 变得更强
本文作者
产品经理高天明、产品经理吴学飞、产品经理袁泽玺、产品经理张宇
全文共 2676 字,阅读大约需 15 分钟。
20w+超大规模探针采集
痛点难点
1.机房多,不同的区域网络隔离,探针上报数据联通配置复杂?
2.服务动态扩缩容时,探针随进程停止而消亡,缓存数据无法上报?
3.流量峰值后端处理压力大?
方案简述
ONE 平台采用探针三层架构的方式,将 SmartAgent 和 SmartGate 根据网络区域 ID 划分上报路径。SmartAgent 和 SmartGate 同一网络区域内相互可见,SmartAgent 根据链路负载策略选择最佳上报路径,平衡流量负载。
用户价值
解决数据联通问题:部署 SmartAgent、SmartGate、配置简单,通过配置一个网络区域 ID 轻松搞定。
流量削峰、数据缓存,防止数据丢失:默认缓存 650MB 数据,可配置缓存数据大小,自动滚动清除历史数据。
SmartGate 转发能力强,资源消耗低:单机 4CPU、8GB 配置下,SmartGate 最大接入支持 4.1K 个探针,资源消耗 CPU:40%左右,内存消耗 220MB。
低代码流式数据集成
产品概述
让复杂的数据集成在几分钟内通过可视化配置完成。
仅需 2 步,即建立数据接入平台和 Bonree 间的连接,就可以快速构建数据流拓扑。且支持在数据流实时同步过程中按业务需求对数据模型和内容进行复杂转换和处理。
简单、直观、强大的数据集成
如此简单
Bonree 针对国内外主流数据服务提供商及云平台提供了开箱即用的特色数据接入解决方案。选配数据源,数据直达监控平台。
如此直观
低代码式数据流配置让您直观看到数据的处理流,无需埋头分析冷冰冰的代码。
如此强大
强大的数据处理组件,无论是结构/半结构/异构数据的各种数据结构数据,在 OneIntegration 面前统统不在话下。
通过实体及关系提取,补充数据视角,规范数据体系。
200+技术组件轻松接入
方案简述
ONE 平台采用 SmartGate 采集技术组件(中间件)的业务指标,支持自集成 Exporter 直接的部署,以及对接外部部署的 Prometheus Exporter。覆盖 Prometheus 已有的所有技术组件监控对象类型。
用户价值
开箱即用:内置 Redis、Redis Cluster、Kafka、MySQL、Tomcat、ES、Druid、Nginx、Zookeeper 等 9 种技术组件的最佳实践仪表盘,方便用户快速巡检对比。也支持用户根据仪表盘自行搭建仪表盘,方便用户个性化需求。
200+技术组件监控轻松接入:配置接入方式统一,内置技术组件和自定义组件接入步骤一致,在配置界面三步即可完成接入。
业务分析洞察业务和技术关联
方案简述
业务事件是 ONE 平台业务分析的最小业务单元,在客户的业务体系中每个业务事件都负责完成一种特定的业务目标(比如:登录、查询用户信息、提交订单等)。客户可在 ONE 平台配置业务事件采集规则,ONE 探针(Smartagent、客户端 SDK)将会根据用户配置规则自动采集业务事件并上报,包括:事件关键业务参数、事件关联业务上下文等;已上报数据待系统自动进行事件注册及指标聚合后即可在业务分析模块及平台其它通用功能(如:仪表盘、告警等)中消费使用。
业务事件采用标准 cloudevent 格式,支持数据集成;如客户存在系统中关键业务参数加密不支持采集或客户存在其它来源业务数据等情况,可通过自定义上报的形式向业务分析模块集成数据后使用平台业务分析能力。
用户价值
业务事件分析:业务事件分析提供业务表现和系统质量两种视角,客户可直观感受对应业务的真实表现及业务关联运维实体的质量表现,同时提供数据对比视图及数据关联追踪能力,让客户能深入分析业务异常是否与系统质量相关,如相关可继续追踪关键记录以确认根因进行优化修复。
事件业务表现
事件系统质量
对比追踪
业务线概览:ONE 平台提供业务线概念供用户进行业务事件管理,客户可以根据组织内的职责划分将各个业务事件划分到不同业务线下,并为业务线添加概览仪表盘,以对整个业务线的业务相关情况进行关注。
业务流程分析:ONE 业务分析模块支持客户按自己的实际业务路径将业务事件组合定义为一个个业务流程,系统将自动根据业务事件上报数据为客户提供对应业务流转化、用户体验、业务事件表现相关的分析内容,帮助客户快速发现业务流程中的瓶颈节点并协助用户判断瓶颈的出现是否与用户体验相关。
业务全局视图:业务全局视图是 ONE 平台业务分析模块根据用户已定义的业务流程及对应业务事件数据自动组织形成的业务流转相关的全局视图,此视图可以帮助客户了解自己业务体系的业务总体流转情况及各流程直接的依赖情况,并给出用户已存在的业务事件、业务线、业务流表现相关的见解。
全局视图
业务见解
日志分析构建“真正”全链路可观测场景
产品概述
解决用户日志管理中的烦恼,专注挖掘日志中的业务价值。
简单、强大、实惠的日志分析
如此简单
平台支持 SmartAgent 采集日志,无需配置,自动发现重要日志路径。对于未检测到的路径,支持自定义数据源,极大地降低采集门槛。
如此强大
支持实时查看所有接入的日志:LIVETAIL 模式支持实时查看所有接入的日志数据,即使我们并没有存储它。在排查问题时,可实现多主机下的 grep 查询。
指标数据基于全量日志生成,但是日志并不需要全量存储:平台支持基于全量接入的数据进行指标分析,可以基于全量的日志生成指标,以便分析日志的趋势。
字段提取自动灵活:GROK 自动生成解析规则,支持灵活的字段识别与标准属性,对于复杂系统中多 KEY 同义字段可以实现串联。
如此实惠
大容量的日志数据,支持实时查看全量数据,在保证整体可见度的情况,仅存储部分日志,降低存储成本。
操作分析洞察用户体验
什么是用户体验
数字业务是通过用户和应用之间的交互来进行的。用户操作,应用执行其业务逻辑,最终反馈用户,如此往复。用户体验就是衡量这个过程的顺畅程度,要衡量用户体验,必须将用户操作和应用的代码执行、反馈关联起来。
行为和性能数据割裂
1.行为分析厂商只采集了用户行为数据,但在用户操作之后,应用具体是如何反馈的,执行了哪些代码是无法知道的,也就无法度量应用质量和用户体验。
2.传统的客户端应用性能厂商虽然采集了用户行为和应用反馈数据,但没有将二者关联,也就无法度量应用质量对用户体验的影响。
我们的方案
代码级准确关联用户操作及之后应用执行的方法。如:是否执行了发送请求的方法?是否执行了 json 解析?是否有奔溃卡顿等可能影响用户体验的方法?
热点方法定位性能瓶颈
痛点难点
1.按条排查缓慢调用链,效率低,单条调用链定位到的缓慢方法不具备问题的共性解释?
2.非埋点方法怎么定位执行缓慢的问题?
方案简述
ONE 平台采用采集调用链的同时,采集服务的堆栈快照。聚合堆栈快照,分析栈顶方法的贡献占比(栈顶方法出现的次数)。通过贡献占比 TOP 即可分析非埋点方法的执行情况,定位服务缓慢的具体方法。
用户价值
资源消耗低:对比传统的代码性能分析工具,性能损耗只占 0.1~1.2%左右。
步骤简单:无需手动部署性能分析工具,配置调试,开启调用链采集即可。
及时性高:实时聚合堆栈信息,可分析任意一段时间内的服务性能问题。
性能瓶颈分析:通过 ONE 平台内置的方法分类规则,可按磁盘 IO、网络 IO、Lock 等待、Waiting 等待、业务代码执行查看服务运行占比高的功能分类,从而分析服务性能瓶颈。
版权声明: 本文为 InfoQ 作者【博睿数据】的原创文章。
原文链接:【http://xie.infoq.cn/article/32cd559abaeb4ebea115a8191】。文章转载请联系作者。
评论