写点什么

移动端应用性能多维监控——崩溃监控系统

  • 2023-03-15
    山东
  • 本文字数:2197 字

    阅读完需:约 7 分钟

01 项目背景

应用上线后的性能表现直接关系到用户的使用体验,影响用户的留存和忠诚度。根据友盟的调查数据,“如果应用发生崩溃,冻结或报错等现象,尤其是程序减速或崩溃卡死几秒钟这样的现象,53%的用户会将 APP 卸载”。

分析市面上第三方崩溃系统,发现存在数据权限受限、数据维度缺失、数据不准确、预警不完善、服务对接难、费用高昂等多种问题,严重影响系统的使用体验、问题分析的便利性和处理效率。

鉴于相关第三方产品所存在的问题,三翼鸟数字化技术团队从 2022 年 1 月开始进行自主研发。

02 项目目标

  1. 赋能海尔智家各智慧小微产业移动端应用快捷地获取应用崩溃监控能力;

  2. 为接入应用提供实时、准确、清晰的崩溃数据,助力应用高效处理线上问题。

03 项目特色

  1. 全类型采集:全面采集底层到应用层多种类型崩溃问题,包括 Java、native、Mach 异常、NSException 等;

  2. 智能解析 &聚类:智能定位特征值,海量问题精准聚类;

  3. 可视化呈现:多维解析崩溃数据,全盘可视化,分析环节多步合一;

  4. 深度分析:日志检索、用户追查,还原问题轨迹,快速聚焦问题核心;

  5. 多策略预警:预警指标灵活组合,全景监控,实时告警;

  6. 服务及时,0 费用:一站式接入平台服务毫秒级响应,0 接入费用。

04 特色功能

「 数据概览 」

  • 今日数据实时呈现:数据实时刷新;支持查看实时数据、环比昨日同时段数据变化情况,及时发现异常问题;

  • 历史数据多维看板:崩溃趋势、新增问题趋势、部门分布等多种关键指标的可视化看板;历史数据保存时间达 180 天。

「 崩溃分析——数据可视化呈现 」

历史趋势变化、多维分布:堆叠面积图展示总体变化趋势; 条形图展示关键维度分布情况以及 TOP 占比;可查看选定版本、时间范围的新增问题。

「 问题详情 」

  • 问题详情分析:支持查看问题首次上报、近期上报的时间和版本情况;支持查看问题历史上报趋势和关键维度分布,省去需要分析多个报告的过程;

  • 崩溃报告详情和关键堆栈:系统会对崩溃报告中的关键内容进行提取,直观展示报告关键信息;直观展示崩溃堆栈,快速定位问题根源;支持导出完整崩溃报告。

「 智能预警 」

自定义智能预警:自由选择预警应用版本; 提供阈值、对比昨日及连续多日上涨等规则,多种策略自由组合。

05 价值体现

「 线上崩溃问题在流程优化和效率提升方面有了明显的改观 」

  • 问题发现环节:从最初的被动等待用户反馈变为主动监控、及时修复;

  • 问题修复效果评估阶段:从修复后只能靠人工大量复现变为通过海量用户真实数据评估修复效果;

  • 多部门协同,将崩溃问题清晰地划分了责任团队,驱动各团队目标一致。

「 已支持 5 款应用接入 」

作为平台性产品,已赋能 5 款团队内部应用及产业应用接入监控崩溃问题。

「 帮助接入应用有效管控 APP 崩溃率 」

  • 智家(4 月 0.0997%,10 月 0.0560%)

  • 三翼鸟(6 月 0.0376%,10 月 0.0281%)

  • 三翼鸟工作台(6 月 4.7632%,10 月 0.0239%,崩溃率降低 99.50%)

——低于 App 行业整体崩溃率 10 余倍

「 支持三翼鸟数字化、智家大脑及多个产业团队使用平台处理问题 」

  • 支持 15+团队处理应用崩溃问题;

  • 目前已有累计 200 多位同事使用多维监控系统处理崩溃问题。

「 线上问题累计上报次数 21 万+ 」

  • 累计监控线上问题上报次数 210000+;

  • 累计监控线上问题数量 10000+(聚合后数量);

  • 累计预警触发次数 5000+。

「 平台完成 3 篇专利输出 」

  • 《日志的聚类方法和装置、存储介质及电子装置》

  • 《应用程序崩溃日志的处理方法、存储介质及电子装置》

  • 《iOS 崩溃聚类信息》

「 摆脱对三方系统依赖,提升数据稳定性 」

  • 崩溃系统替换阿里 mPaaS 系统,作为面向集团提供崩溃率数据的唯一出口;

  • 摆脱对 mPaaS 的依赖,提升了数据的稳定性和开发处理问题的效率。

06 技术亮点

「 双端崩溃全类型采集 」

  • 基于主流开源采集方案自研优化,安卓和 iOS 崩溃类型采集较 mpaas 更全面;

  • iOS 数据采集量约阿里 mPaaS 的 2 倍,Android 采集量与 mPaaS 相当。

「 智能提取特征值聚类 」

  • 针对不同问题类型设定差异化聚类规则,智能提取特征值进行聚类;

  • 配合去内存地址聚类、flutter 聚类等规则,相比 mPaaS 聚类更加准确、全面。

「 与 z·one 打通,无需手动上传符号表 」

iOS 问题需上传符号表解析。通过与构建平台打通,实现【应用打包→版本同步→符号表同步→自动解析】的自动化流程,免去手动上传符号表的繁琐操作。

「 崩溃时同步上传用户日志,提升问题处理效率 」

对于疑难问题,单纯依赖崩溃报告难以快速定位。多维系统在发生崩溃时可同步上报用户日志,为崩溃分析提供更多现场数据,疑难问题处理效率大幅提升。

「 数据隔离,研发过程数据不影响线上数据 」

三方系统通常无法区分线上数据与开发自测、提测等过程的数据。多维系统通过版本类型标注功能和分版本数据看板实现数据隔离,避免干扰数据影响线上数据统计结果。

07 本文作者及团队介绍

「 技术架构平台 」通过持续迭代演进移动端一站式接入平台为三翼鸟 APP、智家 APP 等多个 APP 提供基础运行框架、系统通用能力 API、日志、网络访问、页面路由、动态化框架、UI 组件库等移动端开发通用基础设施;通过 ZONE 平台为三翼鸟子领域提供项目管理和技术实践支撑能力,完成从代码托管、CI/CD 系统、业务发布、线上实时监控等 Devops 与工程效能基础设施搭建。


本文源自:三翼鸟数字化技术平台-技术架构平台


卡奥斯开源社区是为开发者提供便捷高效的开发服务和可持续分享、交流的 IT 前沿阵地,包含技术文章、群组、互动问答、在线学习、开发者平台、OpenAPI 平台、低代码平台、开源项目等服务,社区使命是让每一个知识工人成就不凡。

官网链接:https://openlab.cosmoplat.com/

用户头像

打造工业互联网顶级开源社区 2023-02-10 加入

卡奥斯开源社区是为开发者提供便捷高效的开发服务和可持续分享、交流的IT前沿阵地,包含技术文章、群组、互动问答、在线学习、开发者平台、OpenAPI平台、低代码平台、开源项目、大赛活动等服务。

评论

发布
暂无评论
移动端应用性能多维监控——崩溃监控系统_工业互联网_Openlab_cosmoplat_InfoQ写作社区