写点什么

稳定性

0 人感兴趣 · 26 次引用

  • 最新
  • 推荐
https://static001.geekbang.org/infoq/73/737cefb5a0ea0c66d9d71628a280b071.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

剖析多利熊业务如何基于分布式架构实践稳定性建设

分布式服务稳定性工作是一个体系化的建设过程, 需要注重设计,编码, 架构,监控实施、问题闭环等方面的优化,以确保系统整体的高可用性和可靠性

vivo 手机云服务建设之路 - 平台产品系列 04

手机云服务作为每家手机厂商必备的基础服务,其服务能力和服务质量对用户来说非常重要。用户将自己大量的信息数据存储在云端,那我们的云端服务如何保证服务的稳定和数据的安全,以及应对越来越多用户群体的使用?本文将主要介绍vivo云服务系统的建设历程。

https://static001.geekbang.org/infoq/9e/9ec1af7fa7fe6c19fcfd5aaadc542ecc.webp?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

得物社区计数系统设计与实现

社区业务有非常多的数字统计场景,比如需要查询用户发布的图文内容数、用户点赞的视频内容数等等,且这些数字一般都需要能够支持高度精确性、高性能查询和批量查询等能力。

https://static001.geekbang.org/infoq/be/be9ad8b9122528fcfe6a5a220899f396.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

从 0 到 1,亿级消息推送的稳定性保障 | 得物技术

消息推送每天都在我们的手机上发生,如图所示,除非你的手机没有安装App或关闭了通知栏权限。

https://static001.geekbang.org/infoq/c2/c20713d8ef381ee21906bf351fc40911.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

【网易云商】概念解读稳定性保障

GB/T 软件质量系列标准中,稳定不是软件系统的质量特性,业内常说的“稳定性测试”、“稳定性质量保障”等概念的由来是什么?本文站在 QA 的角度,基于业内成功经验和已有的官方标准,尝试从底层逻辑出发盘一盘稳定性质量保障的由来和落地方向。

稳定性治理方法论

用户头像
苏格拉格拉
2022-11-04

从一个应用owner的角度出发,如果接手一个完全陌生的应用,如何保障该系统的稳定性?

https://static001.geekbang.org/infoq/41/415586fd0ea267ac83479da97c139b28.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

浅谈系统稳定性与高可用保障的几种思路

用户头像
得物技术
2022-11-02

高并发、高可用、高性能被称为互联网三高架构,这三者都是工程师和架构师在系统架构设计中必须考虑的因素之一。今天我们就来聊一聊三H中的高可用,也是我们常说的系统稳定性。

https://static001.geekbang.org/infoq/aa/aa4ed7e52c5f645337d45a3531d7f1b4.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

监控告警怎么搭建比较合理?B 站 SRE 实践总结了 4 大关键步骤

是不是经常会遇到,有人在群里@你,告诉你你的系统出故障了,你在犹豫是不是真的出故障的同时还得慌乱地去查找?

得物技术埋点自动化验证的探索和最佳实践

用户头像
得物技术
2022-06-08

埋点对电商类app的业务发展一直有着重要的指导作用,但是其复杂的数据组成使得它的稳定性难以得到保障,往往业务逻辑的一些重构就会导致一些埋点属性甚至是整个埋点的丢失。

新升级!网易数帆轻舟中间件推出运维稳定性管控服务

用户头像
网易数帆
2022-05-12

近日,网易数帆旗下产品轻舟中间件实现功能升级!此次升级中,轻舟中间件推出了全新的运维稳定性管控服务。

https://static001.geekbang.org/infoq/5c/5c0d77c5414c3de1466a4b235cf615d1.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

一个系统工程师的 14 条建议

用户头像
一席
2022-04-17

翻译自《Confessions of a Systems Engineer:Learning from 20+ Years of Failures》作者是 David Argent(Amazon)在SRECon的演讲

黄金排障场景之 Coredump

用户头像
焦振清
2022-03-26

对真实世界的近100个coredump进行分析,给出coredump的发现、定位、止损和预防方案以及最佳实践

https://static001.geekbang.org/infoq/4e/4e28f13dfb3a94d674770ae278d4dbf5.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

阿里稳定性指标 1-5-10 解读

用户头像
焦振清
2022-02-19

1-5-10的指标解读:1分钟发现、5分钟处置、10分钟恢复

阿里云消息队列 RocketMQ、Kafka 荣获金融级产品稳定性测评 “先进级” 认证

在混沌工程技术沙龙--金融行业精品专场的分布式系统稳定性评估体系获奖名单中,阿里云分布式消息队列服务成为通过首批消息队列服务稳定性认证,荣获最高级别 “先进级” 认证的消息队列服务。

运维体系建设思考 - 稳定性篇

用户头像
ning
2021-11-19

工作以来一直在做运维平台相关的研发工作,最近计划总结下对运维体系建设的思考,总结出一个通用模型,后续持续迭代,欢迎一起探讨交流。运维的工作主要有三个方向,稳定性、效率、成本,本篇是第一篇,稳定性篇。

https://static001.geekbang.org/infoq/fa/faa66dd9842c27fa72938852bad33611.png?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

快手微服务架构技术交流会

用户头像
快手中学
2021-11-04

点击图片/链接即可报名https://5053818435785.huodongxing.com/event/9622018260900

https://static001.geekbang.org/infoq/90/90f01dd577ed319f1212ad0343b07666.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

爱奇艺 iOS 稳定性测试实践

稳定性测试是长时间持续运行APP,以验证应用是否稳定的测试。它可以有效发现APP长时间运行下的偶发闪退、内存泄露、性能变差等问题。iOS端通常由苹果系统的API快速执行点击事件,开展稳定性测试,类似的优秀工具如FastMonkey等虽然有诸多好处,但是作为长期运

系统的可靠性 Reliability

用户头像
BlockQuant
2021-09-17

我们在设计软件系统的时候,一般要考虑几个基本的目标:高可靠,可扩展,可维护。

【得物技术】直播服务监控告警归因实践

用户头像
得物技术
2021-09-03

伴随得物社区、直播业务快速发展,用户体量也越来越大,服务的稳定性要求日益趋高。那如何快速的对监控告警进行归因、快速的解决问题,我想每个人都有自己的排查定位手段。

https://static001.geekbang.org/infoq/0b/0bde4c3fca57759d039c21fc7193c3cd.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

现代分布式架构设计原则 - 可靠性

用户头像
余朋飞
2021-08-01

可靠性(Reliability)是指微服务系统在面对异常情况时,如关键组件损坏、流量或数据量异常、延迟波动、级联故障传导、分布式集群雪崩、系统过载等等,能够持续保持稳定运行或快速恢复的能力。

【得物技术】浅谈资损防控

用户头像
得物技术
2021-07-04

资损通常来讲是指支付场景下的资金损失,这里可以从用户角度与公司角度两个维度看。

干货|车来了 APM 应用性能体验实践

车来了是以大数据、人工智能技术为基础,通过连接人与车,提供智慧交通、城市公共出行等服务的实时公交App,目前在实时公交领域排位全国第一,已覆盖超过350个城市,用户量超过1.5亿,月活用户超过3000万。

解析软件系统稳定性的三大秘密

摘要:随着软件复杂性越来越高,稳定性的保障越来越难,随着服务规模越来越大,稳定性的重要性越来越高。工程师在设计和开发软件的时候,要坚持底板思维。

https://static001.geekbang.org/infoq/aa/aa5a49cf00ae5e011d07145d8bf2cfdb.jpeg?x-oss-process=image%2Fresize%2Cw_416%2Ch_234

谁能让你安稳

用户头像
Neco.W
2020-05-19

自己才能让自己安稳。

Redis 稳定性实践

用户头像
心平气和
2020-05-17

本文会讲述作者在线上环境使用redis遇到过的一些坑,主要是一些参数配置和选型,目的只有一个:如何让redis不挂,提高可用性;不涉及到集群方案的选型等内容。

稳定性_稳定性技术文章_InfoQ写作社区