LSF 集群全面监控!浅析 HPC 基于龙蜥操作系统的迁移替代解决方案
近日,北京常青藤开源科技有限公司(以下简称“常青藤开源科技”)与龙蜥社区完成基于龙蜥操作系统( Anolis OS )安装部署 HPCinsights 监控平台解决方案,进一步助力龙蜥操作系统在高性能计算领域的优化、提升。
芯片企业在芯片日常研发中,存在高性能计算(HPC) 集群资源平均利用率不高,同时伴随大量 pending 作业,以及作业平均等待时间较长等问题,对企业日常芯片设计整体进度造成不利影响。
HPCinsights 是一款对 HPC 集群进行监控和智能分析的软件,不仅具备常见的系统监控能力,也可以在作业资源分析、多维度资源统计和作业资源实时监控等方面,实现快速发现 HPC 集群存在的配置和使用问题,全面掌控集群资源状况,优化集群资源分配。
常青藤开源科技加入龙蜥社区后开展深入合作,基于龙蜥操作系统( Anolis OS )安装部署 HPCinsights 监控平台,实现对 LSF 集群资源调度使用情况进行全面监控和配置优化,从而提升芯片设计相关工作整体进度。通过对其 HPC 队列作业进行可视化分析,快速识别出集群使用的多个问题。HPCinsights 平台对 IC 设计计算任务进行统计、 查询、分析和资源监控,持续优化和改进 LSF 集群配置,集群资源利用率和作业平均等待时间得到较大提升,充分利用了现有服务器资源,并为后续芯片设计上云提供了数据支撑。
HPCinsights 软件产品和 Anolis OS 联合解决方案的完成,不仅解决了企业对国外产品高度依赖带来的 IT 成本和安全隐患影响,又可以在同等条件下获得到更好的技术支持和服务保障。在操作系统快速发展的支持下,摆脱对国外产品的依赖,使我们在信息安全防控上更加具有主动权。
龙蜥社区始终秉持着“中立开放”的原则继续诚邀各企业与龙蜥操作系统(Anolis OS),围绕兼容适配、技术合作、商业版发行等多角度进行逐步合作,欢迎各位合作伙伴来进行产品适配或安装部署解决方案等,如有适配需求,请联系:陈佳 jackie.cj@openanolis.org
「龙腾计划」自发布以来,已有超过百家企业签署 CLA 协议加入龙蜥社区,包括安全厂商格尔软件、海泰方圆,数据库厂商南大通用、巨杉数据库,中间件厂商东方通、中创中间件、宝兰德等,欢迎更多企业加入。
龙腾计划可参看:“龙腾计划”启动!邀请 500 家企业加入,与龙蜥社区一起拥抱无限生态。
—— 完 ——
评论