写点什么

云平台监控指标的设定

  • 2023-03-23
    北京
  • 本文字数:727 字

    阅读完需:约 2 分钟

本文分享自天翼云开发者社区 @《云平台监控指标的设定》,作者:AE86 上山了


为了确保存储和服务器能应付不断增长的业务需求,对磁盘资源、内存和 CPU 资源、宿主操作系统进行监控是必要的。

1.磁盘资源

服务器硬盘是磁盘资源中最慢的组件,在企业数据中心,仔细设计存储子系统,不要让它成为主要的性能瓶颈。

建议:

使用 SAN,即使预算不允许,也要确保磁盘资源争用不会导致虚拟机瘫痪;

应将宿主机操作系统安装到专用硬盘上(不是专用卷),确保宿主操作系统不会与虚拟机抢夺磁盘资源。

RAID 阵列是满足虚拟服务器性能必须的,RAID 1 或 RAID 10(提供更好的容错)。

优先考虑磁盘转速 10K RPM 的硬盘,比 7500 RPM 贵但性能表现好;

热插拔的 SCSI 硬盘(否则换硬盘得关闭系统),尤其当多个虚拟服务共享一个存储阵列时;

监控指标:

每秒 I/O 数(IOPS 或 TPS)

吞吐量(thoughput)

平均 IO 数据尺寸

磁盘活动时间百分比

服务时间(磁盘读或写执行的时间,包括寻道、旋转时延和数据传输等),如果该值超过 20ms,一般认为会对上层应用产生影响。

I/O 等待队列长度

等待时间(队列中排队的时间)


2.内存和 CPU

监控指标:

CPU 使用率

CPU 空闲率(判断 CPU 是否瓶颈的方法 1,运行队列大于 CPU 核数 3~4 倍)

内存使用率(判断内存是否为瓶颈,至少有 10%的可用内存,内存使用率上限 85%)


3.宿主操作系统

独立的虚拟化产品,VMware、Hyper-V

保留宿主操作系统中必须的进程

确保宿主操作系统上防病毒软件不要扫描虚拟硬盘与虚拟机相关的任何文件

宿主操作系统的处理器调度方法

空闲时间安排碎片整理

————————————————

版权声明:本文为 CSDN 博主「偶窝 age」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。

原文链接:https://blog.csdn.net/weixin_37991446/article/details/108089819

 

用户头像

还未添加个人签名 2022-02-22 加入

天翼云是中国电信倾力打造的云服务品牌,致力于成为领先的云计算服务提供商。提供云主机、CDN、云电脑、大数据及AI等全线产品和场景化解决方案。

评论

发布
暂无评论
云平台监控指标的设定_天翼云开发者社区_InfoQ写作社区