监控

0 人感兴趣 · 23 次引用

  • 推荐
  • 最新
https://static001.geekbang.org/infoq/3b/3b2f595270dc12287696528d0f735963.jpeg?x-oss-process=image/resize,w_416,h_234

3W 字干货深入分析基于 Micrometer 和 Prometheus 实现度量和监控的方案

用户头像
Throwable 2020 年 7 月 12 日

最近线上的项目使用了spring-actuator做度量统计收集,使用Prometheus进行数据收集,Grafana进行数据展示,用于监控生成环境机器的性能指标和业务数据指标。一般,我们叫这样的操作为"埋点"。SpringBoot中的依赖spring-actuator中集成的度量统计API使用的框架

https://static001.geekbang.org/infoq/a2/a237bb1499d67d5a134027c7f6ff1e55.jpeg?x-oss-process=image/resize,w_416,h_234

在线游戏,如何把握住 1 个亿以上的 DAU?

用户头像
BonreeAPM 2020 年 9 月 16 日

然而,尽管拥有着庞大的用户群储备,不过面对有可能瞬间出现井喷的流量增长,在线游戏厂商在产品设计、IT运维上却并不一定做好了准备,并有可能错失商机。

https://static001.geekbang.org/infoq/80/804c271ac82aa58f4080218c8b1955e3.jpeg?x-oss-process=image/resize,w_416,h_234

勇攀监控高峰 -EMonitor 之根因分析

用户头像
乒乓狂魔 2020 年 5 月 22 日

阿里集团针对故障处理提出了“1/5/10”的目标-- 1 分钟发现、5 分钟定位、10 分钟恢复,这对我们的定位能力提出了更高的要求

https://static001.geekbang.org/infoq/02/02eadef02f2fbe262ced58ca15cd1d58.png?x-oss-process=image/resize,w_416,h_234

记一次混合监控的反思

用户头像
雪雷 2020 年 8 月 22 日

作为最底层的技术人员,目前由于有客户在运维中遇到混合架构,公有云上使用了产品级别Redis数据库,同时由于业务在云服务器和kubnets的容器内也有redis数据库,因此对于这种混合模式数据库的监控,进行简单的分析总结,在此记录笔记,在此抛砖引玉,也曾希望

https://static001.geekbang.org/infoq/c2/c2e9863549ba1fc6ed54850c02a2bf44.png?x-oss-process=image/resize,w_416,h_234

什么才是“应用拓扑”?

用户头像
小清新同学 2020 年 9 月 25 日

应用或服务级监控中有一个非常重要的概念–拓扑,拓扑反映了应用内多个服务之间的调用关系,这种拓扑与传统的网络拓扑存在明显区别,什么样的应用拓扑才是运维监控领域最有价值的拓扑呢?

https://static001.geekbang.org/infoq/ca/cae40011e71552451538374b8b73bbb5.png?x-oss-process=image/resize,w_416,h_234

前端如何搞监控总结篇

用户头像
大前端洞见 2020 年 4 月 27 日

如何搭建一套多端错误监控平台

https://static001.geekbang.org/infoq/54/54175c28a3c9cfe015443e8f7f0b3232.png?x-oss-process=image/resize,w_416,h_234

深入浅出开源监控系统 Prometheus(上)

用户头像
vivo互联网技术 2020 年 7 月 22 日

本文从“监控”这件事说起,深入浅出Prometheus的架构原理、目标发现、指标模型、聚合查询等设计核心点。

Kafka 实战宝典:一文带解决 Kafka 常见故障处理

用户头像
WindyQin 2020 年 8 月 12 日

Kafka的bin目录下shell脚本是kafka自带的管理工具,提供topic的创建/删除/配置修改、消费者的监控、分区重载、集群健康监控、收发端TPS压测、跨机房同步等能力,Kafka运维者可以使用这些工具进行集群的管理。

从大数据的角度来谈谈运维监控这件事儿

用户头像
小清新同学 2020 年 9 月 25 日

做运维的人对监控这件事儿都太熟悉了,但是对于监控这么一件老生常谈的事儿,我们今天换个角度,从大数据的角度来看看有什么新的发现。

https://static001.geekbang.org/infoq/3c/3c7ba7e4a503944c9c87a7bc7477de22.png?x-oss-process=image/resize,w_416,h_234

Prometheus + Grafana 详解

用户头像
雪雷 2020 年 8 月 21 日

Prometheus 是一个开源监控系统,它前身是 SoundCloud的告警工具包。从 2012 年开始,许多公司和组织开始使用 Prometheus。该项目的开发人员和用户社区非常活跃,越来越多的开发人员和用户参与到该项目中。目前它是一个独立的开源项目,且不依赖于任何公司。

https://static001.geekbang.org/infoq/74/7400eba39bd20d64037a16925d43cb43.png?x-oss-process=image/resize,w_416,h_234

开源监控系统 open-falcon 搭建笔记

用户头像
卓丁 2020 年 10 月 10 日

搭建开源监控系统open-falcon时可能遇到的一些问题

https://static001.geekbang.org/infoq/90/907b4b0bdd67ca200106af81557b0091.jpeg?x-oss-process=image/resize,w_416,h_234

监控应用,应该监控什么?

用户头像
小清新同学 2020 年 9 月 25 日

系统阐述应用监控的多种思路及方法,并进行简单的对比。

https://static001.geekbang.org/infoq/d8/d894d912bcd8be0dc46bb390c4f76ef4.jpeg?x-oss-process=image/resize,w_416,h_234

小师妹学 JavaIO 之: 文件系统和 WatchService

用户头像
程序那些事 2020 年 6 月 8 日

小师妹这次遇到了监控文件变化的问题,F师兄给小师妹介绍了JDK7 nio中引入的WatchService,没想到又顺道普及了一下文件系统的概念,万万没想到。

https://static001.geekbang.org/infoq/a4/a46e75f1e33036eef93593c5c9a26dec.jpeg?x-oss-process=image/resize,w_416,h_234

Windows AD 日志分析告警平台—WatchAD 安装教程

用户头像
Young先生 2020 年 8 月 13 日

WatchAD收集所有域控上的事件日志和kerberos流量,通过特征匹配、Kerberos协议分析、历史行为、敏感操作和蜜罐账户等方式来检测各种已知与未知威胁,功能覆盖了大部分目前的常见内网域渗透手法。

https://static001.geekbang.org/infoq/87/87030878aca303f3497b5c6996cb379c.png?x-oss-process=image/resize,w_416,h_234

Linux 系统监控工具推荐

用户头像
王坤祥 2020 年 8 月 24 日

你是否曾经遇到过服务器运行缓慢,但是CPU使用率看起来不是很高的情况?你是否遇到过服务器的网络利用率很高,但是定位不到导致高网络利用率的进程的情况?下面几个监控工具让你原地起飞。

https://static001.geekbang.org/infoq/db/dbcefa2116e2320f4840638c26c773f6.jpeg?x-oss-process=image/resize,w_416,h_234

iOS Abort 问题系统性解决方案

用户头像
应用研发平台EMAS 2020 年 8 月 12 日

针对iOS客户端的Abort问题,进行根因定位分析,给出系统性解决方案

https://static001.geekbang.org/infoq/b5/b5357a2b7fddb7d017031e71d34e0f5a.jpeg?x-oss-process=image/resize,w_416,h_234

共享内存原理与 VCS 监控采集实战

用户头像
vivo互联网技术 2020 年 9 月 17 日

共享内存广泛用于Redis,Kafka,RabbitMQ 等高性能组件中,本文主要提供一个共享内存在广告埋点数据采集的实战场景。

https://static001.geekbang.org/infoq/45/45c21ff4b2b2f520baf3dccc618837b1.png?x-oss-process=image/resize,w_416,h_234

Zabbix 实战指南

用户头像
橙子冰 2020 年 5 月 26 日

在一家中小型银行,负责行内zabbix监控系统的工作,从系统的搭建到最后的维护都是自己,整个过程遇到了很多问题,现在想系统的整理出来,愿后来人少走歪路!

https://static001.geekbang.org/infoq/36/36f1a79b8da2f122850925752e409050.jpeg?x-oss-process=image/resize,w_416,h_234

危与机并存 保险业如何走好线上线下业务并举转型之路?

用户头像
BonreeAPM 2020 年 9 月 16 日

如今,保险公司正在积极打造在线业务销售、在线组织发展和在线业务管理等体系,形成线上经营的闭环。这些创新的业务模式可以推动保险行业走向线上与线下联动经营的新阶段,从而进一步将保险业务发展的风口从人口红利推向科技红利。

https://static001.geekbang.org/infoq/c2/c2b1a5b73fbef3515898a98a7da976ed.png?x-oss-process=image/resize,w_416,h_234

保留时序数据波动细节的一种采样算法

用户头像
小清新同学 2020 年 9 月 25 日

保留时序数据波动趋势的采样算法介绍

https://static001.geekbang.org/infoq/b5/b5794c9796dfd82436559cd2c3e0a1f5.jpeg?x-oss-process=image/resize,w_416,h_234

iOS 性能优化 — 二、卡顿监控及处理

用户头像
iOSer 2020 年 10 月 23 日

上篇文章为大家讲解了crash监控及防崩溃处理,这片文章继续为大家讲解下卡顿监控及处理。

https://static001.geekbang.org/infoq/b9/b99a7022a12e299a591bcb94d4444ca1.jpeg?x-oss-process=image/resize,w_416,h_234

微服务监控:SpringBoot-Micrometer-Influx

用户头像
LanLiang 4 小时前

聊到微服务监控,首先需要考虑的一个技术选型问题就是使用推数据还是使用拉数据的方式进行数据的收集,这个问题这里不进行具体讲解.本文使用micrometer-registry-influx这个组件使用推的方式进行数据的收集.

监控_监控资料文章-InfoQ写作平台