写点什么

如何管理 LAXCUS 计算机集群

作者:JAVA活菩萨
  • 2022 年 8 月 05 日
  • 本文字数:1917 字

    阅读完需:约 6 分钟

如何管理LAXCUS计算机集群

Laxcus 计算机集群有大量的节点,分散在各种异构环境中运行,虽然计算机集群的大部分管理业务,已经通过 Laxcus 分布式操作系统内置的 DFL3 人工智能模型实施,但是仍然有小部分工作需要人工干预。在 Laxcus 分布式操作系统 6.0 之前的版本中,管理员为用户分配计算存储资源,检查集群和节点的运行状态,需要使用命令行远程检索和操控这些节点。因为字符界面和命令行本身的局限性,管理计算机集群缺少直观的体验感受。升级 6.0 版本后,管理计算机集群有专门的 Watch 节点来实施这项工作,这是一个图形化的桌面环境,类似于 Windows 桌面,同时在 Watch 节点桌面上,计算机集群的管理交互和功能展示工作,则由“我的集群”来负责。 ​



“我的集群”是基于 Laxcus 分布式标准开发的应用软件,被集成在 Watch 节点。打开这个软件后,首先出现的是一个启动封面,然后计算机集群中的所有节点,都会显示在这个软件的图形界面上。 ​



“我的集群”启动封面​

“我的集群”左侧分别是“集群节点”和“集群用户”。在 Laxcus 是一个多域计算机集群,包括有 BANK 集群、HOME 集群、TOP 集群。在 Laxcus 分布式操作系统的体系中,BANK 集群被定义为管理计算机集群的用户资源,有 ENTRANCE、GAET、HASH、ACCOUNT 四类节点。HOME 集群被定义为负责具体的工作业务,各种大规模、超大规模的分布式存储和分布式计算工作,以及分布式应用软件的运行,都在 HOME 集群中处理,有 CALL、DATA、WORK、BUILD 四类节点。TOP 集群则是负责总体的业务规则分配和调度工作,有 BANK、HOME、LOG 三类节点。Watch 节点启动时,可以登录到 BANK、HOME、TOP 任何一类节点。登录成功后,打开“我的集群”这个软件,相关节点以及节点的各种信息,就在显示在软件界面上。 ​

集群用户一栏显示的是用户信息,分为“注册用户”和“在线用户”两种。注册用户表示系统已经通过“CREATE USER”命令,被系统接受登记和获得某些授权。在线用户则是用户在获得授权情况下,登录进入 Laxcus 计算机集群,处于激活工作状态。 ​

与 Laxcus 计算机集群交互,目前主要通过“我的集群”的检索栏来执行,这类似 Windows 11 的“搜索”功能,需要输入关键字或者命令,然后交给“我的集群”后端来处理执行。比如管理员需要检索当前 BANK 集群有多少 GATE 节点,以及 GATE 节点的地址情况时,可以输入关键字“GATE SITES”,系统会把相关的“GATE”节点突出显示出来。或者管理员需要查阅某个用户信息和节点分布情况,可以通过关键字“USER 用户名称”来实现,这时这个用户的集群节点的物理分布以及其它信息,会一并显示在下方。 ​




检索栏同时支持 Laxcus 分布式命令。Laxcus 分布式操作系统有大量的分布式命令,查阅它们可以输入“HELP 命令关键字”来检索。比如输入“HELP SET*”后,会在桌面弹出帮助窗口,上面将显示与“SET”关键字相关的所有命令。 ​




“我的集群”运行过程中,后台会定时检索每个节点的运行状态。这些信息通过右侧的“运行节点”显示出来,包括每个节点的 CPU、内存、磁盘使用占比,在线人数、分布式应用软件运行规模等。使用“SET OUTLOOK INTERVAL”命令,可以改变检索间隔时间。比如输入“SET OUTLOOK INTERVAL 30 秒”,表示间隔 30 秒会刷新新一次所有节点记录。最小的检索间隔时间,我的集群规定是 10 秒钟。 ​



另外“我的集群”还有一个支持高亮显示的命令窗口,它和功能和检索栏类似,区别是字体可以调节点,可用空间更大,为集群管理员多提供一个管理集群的输入接口。 ​



“我的集群”除了向集群节点发起检索请求,集群上的每个节点也会主动向“我的集群”投递运行信息。这些运行信息主要是一些警告和故障,比如发生 CPU 超载,内存、硬盘空间不足,在线人数达到最大运行规模、分布式应用软件运行过程中出现故障时,这些节点就会主动将信息投递给“我的集群”,在图形界面上,以文字、图像、声音的方式显示出来,提示管理员注意,让管理员调整修改运行规则,动态增加计算机节点等工作。 ​

在支持第三方扩展应用上,“我的集群”也同样做到了。但是需要开发者熟悉 Invoke/Produce 模型,根据 Laxcus 分布式操作系统分布式编程规则,通过 DAPI 接口编写分布式应用插件来实现。 ​

Laxcus 分布式操作系统把大量的分布式处理工作都隐藏在命令中,目前已经有三百多个命令,各位有兴趣可以去尝试一下。它们与 Windows、Linux 只在本地执行的单机命令完全不同,Laxcus 分布式命令会同时分散到很多计算机节点上并行执行,处理能力和处理效率不在一个数量级。 ​

了解更多 Laxcus 分布式操作系统的图形设计、网络通信、分布式存储、大数据、分布式计算、边缘计算、人工智能、云原生、安全管理、分布式应用软件开发和其它前沿技术,请关注公众号“Laxcus 分布式操作系统”,或者微信 Laxcus 加入产品技术群,让我们一起讨论最新的技术知识。

用户头像

JAVA活菩萨

关注

还未添加个人签名 2022.07.25 加入

还未添加个人简介

评论

发布
暂无评论
如何管理LAXCUS计算机集群_Java_JAVA活菩萨_InfoQ写作社区