MapReduce Service 更换集群外部时钟源,仅需 10 步
摘要:MapReduceService 集群使用 NTP 进行时钟同步。本文简要介绍了 MapReduce Service 集群 NTP 机制及 NTP 的配置方式。
本文分享自华为云社区《MapReduce Service更换集群外部时钟源》,作者:tangyuxiaobao29。
1、MapReduceService 集群 NTP 机制
1、FusionInsight 的主 OMS 节点向 NTP 外部时钟源同步
2、所有业务节点向 OMS 主节点同步
基于上述原理可以看出,实际上整个集群都是最终向 NTP 时钟源同步的,这样做的最大好处是:无论何时,整个集群内的时钟始终都是与主 OMS 同步的,至少保证了集群内节点时钟同步。如果外部 ntp 时钟源没任何问题,那么整个集群也是与外部 ntp 时钟源同步的!
2、MapReduceService 配置 NTP 服务器实现说明
一、安装 FusionInsight Manager 阶段配置 NTP 服务器
FusionInsightManager 安装配置文件 install.ini 中通过 ntp_server_ip 参数设置外部 NTP 时钟服务器 IP 地址。该参数可选。
当不设置该参数,系统默认使用主管理节点作为 NTP 服务器。安装后主 oms 节点 ntp 状态
集群内非主 oms 节点 ntp 状态
当设置该参数且存在多个 NTP 服务器,需要以英文逗号隔开各 IP,如 192.168.34.185。安装后主 oms 节点 ntp 状态
集群内非主 oms 节点 ntp 状态不变
二、安装后更换集群 NTP 服务器
1、操作场景
安装 FusionInsight Manager 管理系统后,如果未配置 NTP 服务器或已配置的 NTP 不再使用,管理员可以为集群重新指定或者更换新的 NTP 服务器,使集群从新的 NTP 时钟源同步时间。
2、对系统的影响
更换 NTP 服务器是高危操作,更换后集群时间可能将会变化。更换 NTP 服务器前 NTP 服务器与集群当前时间偏差大于 150s,则需先停止集群,防止数据丢失。停止集群期间服务无法访问。
3、前提条件
已准备新的 NTP 服务器并获取 IP 地址,并设置好集群与新 NTP 服务器的网络。请确保服务器的 NTP 服务状态正常,否则将导致操作失败。IPv4 组网的集群只支持配置 IPv4 网络的外部时钟源,IPv6 组网的集群只支持配置 IPv6 网络的外部时钟源。如果集群使用 IPv4 模式,外部时钟源只能用 IPv4 地址;如果集群使用 IPv6 模式,外部时钟源只能用 IPv6 地址。
4、操作步骤
1.登录 FusionInsight Manager,查看是否存在未清除的告警
是,请参见“故障管理”修复告警。告警处理完毕后,执行 2。
否,执行 2。
2.使用 omm 用户分别登录主备管理节点。
3.在主管理节点执行以下命令查看管理平面网关。
cat ${BIGDATA_HOME}/om-server/OMS/workspace/conf/oms-config.ini| grep om_gateway
4.在主备管理节点分别执行 ping 管理平面网关,检查节点是否与管理平面网关连通
是,执行 5。
否,请联系网络管理员修复网络故障,处理完毕后,执行 5。
5.在主管理节点执行以下命令,检查集群时间与新的 NTP 服务器时间偏差。单位为秒。
例如,检查与 NTP 服务器“192.168.34.185”的时间差,执行 ntpdate -d 192.168.34.185,界面显示:
其中 0.034136 表示时间偏差。正数表示 NTP 服务器时间比集群当前时间快,负数表示 NTP 服务器时间比集群当前时间慢。
6.检查时间偏差的绝对值是否超过“150S”。
是,执行 7。
否,时间偏差的绝对值不超过“150”,以 omm 用户执行 9。
7.确认是否可以停止集群。
是,停止上层业务并停止集群,然后执行 8。
否,任务结束。
8.确认 NTP 服务器时间是否比集群当前时间慢
是,NTP 服务器时间慢,停止集群界面显示“操作成功”后需等待,间隔大约为 5 得到的时间偏差,再以 omm 用户执行 10。
否,NTP 服务器时间快,停止集群界面显示“操作成功”后直接以 omm 用户执行 10。
9.在主管理节点执行以下命令,更换 NTP 服务器,任务结束。
sh${BIGDATA_HOME}/om-server/om/bin/tools/modifyntp.sh --ntp_server_ip192.168.34.185
执行完毕后检查 ntp 状态
10.在主管理节点执行以下命令,从 NTP 服务器“192.168.34.185”立即强制同步时间并更换 NTP 服务器,任务结束。
sh${BIGDATA_HOME}/om-server/om/bin/tools/modifyntp.sh --ntp_server_ip 192.168.34.185--force_sync_time
说明
NTP 服务器 IP 地址不可以设置为集群内节点 IP 地址,否则可能会导致节点与主备 oms 节点业务网络断连。
当前最多允许配置 2 个 NTP 服务器以主备方式提供服务,可以用“,”将不同服务器分开
如果停止了集群,在更换 NTP 服务器后需要重新启动集群。
未执行强制同步时间命令时,大约以 200ms/h 的速率进行时间同步。
执行强制同步时间命令后,集群节点大约需要 5 分钟完成时间同步。
版权声明: 本文为 InfoQ 作者【华为云开发者社区】的原创文章。
原文链接:【http://xie.infoq.cn/article/3f41e50f1c0f19736666f6ae3】。文章转载请联系作者。
评论