写点什么

监控

1 人感兴趣 · 79 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/b0/b096b57545ae749592ac5c378ab91eb2.png?x-oss-process=image/resize,w_416,h_234

微服务沉思录 - 可观测性

用户头像
余朋飞6 月 15 日

观测性(Observability)是微服务得以稳健运行的至关重要一环。在生产环境若缺乏良好的观测性工具和方法,就好比高空的飞机在没有仪表板的情况下飞行一样,两眼一抹黑,充满不确定性因素和未知风险,无法及时发现、定位、转移和修复错误。

教你在 Kubernetes 中快速部署 ES 集群

​​​​摘要:ES集群是进行大数据存储和分析,快速检索的利器,本文简述了ES的集群架构,并提供了在Kubernetes中快速部署ES集群的样例;对ES集群的监控运维工具进行了介绍,并提供了部分问题定位经验,最后总结了常用ES集群的API调用方法。

开箱即用的 Prometheus 告警规则集

用户头像
张晓辉5 月 30 日

300 多个开箱即用的告警规则,助你方便配置告警。

眼观六路耳听八方还不知疲倦?数仓智能运维服务体系是怎么做到的?

​​摘要:本文主要介绍GaussDB(DWS)数据库智能监控运维服务体系的设计规划和现状。

Kubernetes 稳定性保障手册:洞察 + 预案

稳定性保障是个复杂的话题,需要有效、可迭代、可持续保障集群的稳定性,系统性的方法或许可以解决该问题。

飞猪基于 Serverless 的云 + 端实践与思考

本文主要分享飞猪基于 Serverless 的实践成果以及未来想要做的事情。

KubeVela + KEDA:为应用带来“与生俱来”的弹性伸缩能力

在这篇博文中,我们将简要解释需要考虑的领域,KEDA 如何使应用自动伸缩变得简单,以及为什么阿里云企业分布式应用服务(EDAS)在 KEDA 上完全标准化。

官宣:恭喜 ChaosBlade 项目进入 CNCF Sandbox

阿里巴巴开源的混沌工程项目 ChaosBlade 通过 CNCF TOC 投票,顺利推进 CNCF Sandbox。CNCF,旨在为云原生软件构建可持续发展的生态系统,服务于厂商中立的快速增长的开源项目,如 Kubernetes、Prometheus、Envoy 等。

高德 Serverless 平台建设及实践

高德为什么要搞 Serverless/Faas?是如何做 Serverless/Faas 的?技术方案是什么样的?目前进展怎么样?后续又有哪些计划?本文将和大家做一个简单的分享。

工商银行分布式服务 C10K 场景解决方案

Dubbo 是一款轻量级的开源 Java 服务框架,是众多企业在建设分布式服务架构时的首选。中国工商银行自 2014 年开始探索分布式架构转型工作,基于开源 Dubbo 自主研发了分布式服务平台。

云原生的进一步具象化

云原生这个概念已经越来越深入人心,但对“云原生到底是什么?”这个问题,仍然是各种各样的解读,最近对云原生具体是什么有了点感触,于是写下来分享和探讨下。

云原生下的灰度体系建设

本篇文章,我们将继续为大家介绍 ASI SRE(ASI,Alibaba Serverless infrastructure,阿里巴巴针对云原生应用设计的统一基础设施) 是如何探索在 Kubernetes 体系下,建设 ASI 自身基础设施在大规模集群场景下的变更灰度能力的。

https://static001.geekbang.org/infoq/f3/f35e4a67362bd1f0c6659c25950af194.png?x-oss-process=image/resize,w_416,h_234

百度商业大规模微服务分布式监控系统——凤睛

用户头像
百度Geek说4 月 27 日

作为凤睛早期的接入方、后期的核心成员,笔者经历了整个项目前后四年的变迁,看过项目的艰难开端、中期的默默积累以及后期的蓬勃发展。每一次架构的变迁都带着技术浪潮的烙印,也看到项目成员利用有限资源来解决实际问题而持续不断的创新。

面对大规模 K8s 集群,如何先于用户发现问题?

怎样才能在复杂的大规模场景中,做到真正先于用户发现问题呢?下面我会带来我们在管理大规模 ASI 集群过程中对于快速发现问题的一些经验和实践,希望能对大家有所启发。

Fluid 给数据弹性一双隐形的翅膀 -- 自定义弹性伸缩

弹性伸缩作为K8s的核心能力之一,一直围绕无状态的应用负载展开。而Fluid提供了分布式缓存的弹性伸缩能力,可灵活扩充和收缩数据缓存。 它基于Runtime提供缓存空间、现有缓存比例等性能指标, 结合自身对Runtime资源的扩缩容能力,提供数据缓存按需伸缩能力。

https://static001.geekbang.org/infoq/49/4935fa8bd8511cc3838cc5b7c0c5cbb6.png?x-oss-process=image/resize,w_416,h_234

【得物技术】得物前端性能监控实践

用户头像
得物技术4 月 16 日

对于前端来说,最重要是的体验,而在前端体验中,最为核心的就是性能。秒开率、流畅程度等一系列指标都直接影响用户体验。

https://static001.geekbang.org/infoq/3c/3cd0fa70e63ec63ac31473190d24a2eb.jpeg?x-oss-process=image/resize,w_416,h_234

APM- 技术专题 - 监控系统选型

用户头像
李浩宇/Alex4 月 14 日

必知必会的监控基础知识

cat 监控 http 请求 -CatFilter

用户头像
青乡之b4 月 13 日

CatFilter是用于http监控,即web项目里的controller类里的方法的监控。

基于 RocketMQ Prometheus Exporter 打造定制化 DevOps 平台

本文将对 RocketMQ-Exporter 的设计实现做一个简单的介绍,读者可通过本文了解到 RocketMQ-Exporter 的实现过程,以及通过 RocketMQ-Exporter 来搭建自己的 RocketMQ 监控系统。

OpenTelemetry 简析

OpenTelemetry 是 CNCF 的一个可观测性项目,旨在提供可观测性领域的标准化方案,解决观测数据的数据模型、采集、处理、导出等的标准化问题,提供与三方 vendor 无关的服务。

面对不可避免的故障,我们造了一个“上帝视角”的控制台

本文主要围绕云原生面临的高可用挑战和混沌工程机遇,详细介绍开源控制台的设计、特性和实践和未来规划,旨在帮助企业更好的了解控制台并通过其来实现混沌工程落地,解决云原生系统下高可用问题。

https://static001.geekbang.org/infoq/b2/b2d6f08190aa13c7d948356bec6acb66.png?x-oss-process=image/resize,w_416,h_234

监控系统 -zabbix 快速入门

用户头像
小铨3 月 27 日

监控系统-zabbix快速入门

https://static001.geekbang.org/infoq/a3/a3ddbd140c2c550fd0d8490af75ad2dc.png?x-oss-process=image/resize,w_416,h_234

智能安防监控系统的发展与应用

用户头像
anyRTC开发者3 月 26 日

几年前,智能视频监控还只是在安防圈里谈论的话题。那时候,智能视频监控产品少、贵、基本不实用。近几年,随着硬件处理能力的提升和价格的下降,以及计算机视觉等相关技术的发展,智能视频监控产品已从前几年的演示阶段逐渐进入规模化使用阶段,并成为安防界

五个问题,三大策略,手把手教你定制 App 性能监控方案

用户头像
友盟全域数据3 月 17 日

我们可以统计不同类型错误在某一个时间范围内的错误数、错误率、影响用户数、影响用户占比等指标。在指标的细化分类上,我们还可以用不同的维度定义监控,比如版本号。

云原生时代下,容器安全的“四个挑战”和“两个关键”

云原生的火热带来了企业基础设施和应用架构等技术层面的革新,在云原生的大势所趋下,越来越多的企业选择拥抱云原生,在CNCF 2020年度的调研报告中,已经有83%的组织在生产环境中选择 K8s,容器已经成为应用交付的标准。

Kubernetes 稳定性保障手册 -- 日志专题

不论对于软件的用户还是开发者,日志都是很重要的信息源。日志可以用来表征软件的运行状态,在软件运行不符合预期时提供丰富的信息,也可以用在开发阶段调试软件,方便定位问题。

使用 pyVmomi 采集 vSphere 监控指标

用户头像
冯骐3 月 1 日

VMware 在中小型的企业/单位里几乎是标配了。毕竟规模不大的情况下,性价比还是相当好的。对于 VMware 平台上各项指标,我们当然也要去做监控了。

分布式应用监控与链路追踪:SkyWalking

用户头像
xcbeyond2 月 26 日

SkyWalking 是一个应用性能监控系统,特别为微服务、云原生和基于容器(Docker, Kubernetes, Mesos)体系结构而设计。除了应用指标监控以外,它还能对分布式调用链路进行追踪。类似功能的组件还有:Zipkin、Pinpoint、CAT等。

监控_监控资料文章-InfoQ写作平台