监控系统
0 人感兴趣 · 26 次引用
- 最新
- 推荐
还在服务器上捞日志?试试这款可视化监控系统吧,真香!
如果线上出现问题后,直接去服务器上查看日志,不仅仅效率低,而且还是严重滞后,所以对于一个应用系统必须要具备分布式监控的能力!
ps vs top:CPU 占用率统计的两种不同方式
简单来说,进程的 CPU 占用率指的是 CPU 有多少时间花费在了运行进程上。在 Linux 系统里,进程运行的时间是以jiffies[1]统计的,通过计算jiffies * HZ,就可以得到进程消耗的 CPU 时间,再除以 CPU 的总时间,就可以得到进程的 CPU 占用率
突破传统监测模式:业务状态监控 HM 的新思路
在系统架构设计中非常重要的一环是要做数据监控和数据最终一致性,这里主要讲如何去补偿?补偿的方案哪些?这就引出来数据监控系统了。有小伙伴会问了,为什么业务状态监控系统可以做补偿?别急,且看本文。
通过应用场景深度理解监控宝在业务中的实践价值
近年来,越来越多的企业实现了核心业务系统互联网化,无论是企业内部员工还是企业外部用户或是供应链上下游合作伙伴,均通过互联网和Web应用与企业建立起了紧密的联系。
SLO 新解,一种行之有效的故障处理方法
本文主要不是普及 SLO 概念,而是分析"跟风"SLO方法时可能出现的错误,并介绍一种应用于故障处理场景,并行之有效的"类SLO"实践。
HertzBeat 赫兹跳动 v1.0.beta.4 发布, 易用友好的高性能监控告警系统
HertzBeat赫兹跳动 是由Dromara孵化,TanCloud开源的一个支持网站,API,PING,端口,数据库,全站等监控类型,支持阈值告警,告警通知(邮箱,webhook,钉钉,企业微信,飞书机器人),拥有易用友好的可视化操作界面的开源监控告警项目。
裸辞全职开源的监控告警项目
HertzBeat赫兹跳动 - 开源监控告警系统。 网站监测,PING连通性,端口可用性,数据库监控,API监控,全站监控,自定义监控,阈值告警,告警通知。
基于云的技术架构设计实践 - 第 2 篇
业务部署上去了,要想知道业务是不是正常,需要怎么做? 这时候监控就很重要。监控是业务的眼睛,如果没有监控,我们就会抓瞎。
如何做好 Clickhouse 集群的监控覆盖?
在clickhouse上生产环境之前,我们就得制定好相关的监控方案,包括指标采集、报警策略、图形化监控大盘。有了全面有效的监控,我们就仿佛拥有了千里眼顺风耳,对于线上任何风吹草动都能做到及时感知,在必要的情况下提前介入以避
3 分钟评估 你的运维监控系统是“救命稻草”还是“鸡肋”
摘要:如何提升企业运维监控能力,让我们先从监控成熟度评估开始吧。从运维监控到服务观测,3分钟,5个维度,快速获悉企业的IT资源监控现状。
搭建亿级时间线数据的监控系统,我有绝招!
摘要:本文为你带来如何使用华为云数据库GaussDB(for Influx) + Grafana搭建亿级时间线数据的监控系统。
Mac 下 brew 更新及安装 Prometheus+Grafana
近来在做容器研究,本地也打算做一次基于原生k8s的动态扩容。k8s提供了基于cpu和内存的扩容方案,但如果需要根据其他规则,例如接口访问次数等等,就需要其他的一些辅助工具,例如监控:prometheus。本篇先准备好相关环境,并了解Prometheus和Grafana的使用
搭建一个 802.1x 的 web 测试服务
802.1x 是一种二层认证协议,结合 EAP,它能够为无线网络提供安全的,无感知的认证服务。因此许多大型的园区网都选择使用 802.1x 作为无线网络的认证模式。
树莓派上的家庭监控中心
上回在 树莓派上的温湿度环境监控 里提及过,Open-Falcon 也是可以直接装在树莓派上的。所以其实可以使用树莓派在家里做一个小型的监控中心,把相应的监控指标采集过来推给树莓派上的 Open-Falcon 就好了嘛
常见运维监控系统的技术选型
当今监控乃至整个运维行业正处在变更之际,面对诸多变化和不确定性,运维监控的规划应该首先考虑保证技术投资的可持续性,避免锁定在某一具体的架构和方案上,而是立足核心技术要点与诉求,跟随技术潮流,平滑演进,保持技术先进性,在演进过程中分阶段……
GitHub 热榜:适合初学者学习的 Prometheus 监控系统
GitHub 热榜:适合初学者学习的 Prometheus 监控系统