助力工业化设计,提升变电站三维设计效率和业务保障
能源电力是所有人类行动的动力源泉,尤其是现代信息经济发展的时代,几乎没有可以脱离电力存在的产业。从我国电力行业发展几十年的时间轴看,我们已经经历过起步建设阶段、规模化发展阶段,现如今已经发展到区域电网互联阶段。
经过几十年的快速发展,我国电力能源行业已处于国际领先行列,从超高压输电网络到配电网络,包括各类整体工程设计、产品设备设计等,具备国际领先技术和经验。在“十四五规划”中,国家出台电力行业指导意见,提到电力应快速大力发展,不仅仅在国内成为基建典范,而且要成为国际基建劲旅。从发展态势看“电网互联”已然成为发展趋势,国内输变电基础建设更加深化,形成区域电网互联。
在工程领域“信息化建设”浪潮下,三维数字化设计已经不再是一种趋势,而是深入到每个工程设计人员日常工作的必要组成部分。在传统工业设计架构中,采用“图形工作站+集中存储”的方式构建基础 IT 平台,实现工业设计业务的开展。
其中,图形工作站以提供 CPU、GPU 算力为主,集中式存储存放业务素材,如设计诸元模型等。若是在小规模和低业务压力下,运行尚可,但是随着国家基础建设规模和速度不断增大的市场环境下,已然不能满足业务发展。为此,该如何利用新兴技术解决变电领域三维数字化设计问题成为当下发展关键。
基于上述背景,我们将以某电力信产公司(以下简称:电力公司)变电站工程的三维设计平台为例,探求他们是如何搭建起具备高性能、高可用、高扩展等特性的数据平台。
打造稳健的 IT 基础设施刻不容缓
随着云原生技术的不断发展,数字化转型逐渐成为必然,这也要求电力公司底层 IT 基础设施必须有效满足不断变化的客户需求,以此应对来自多方面的挑战。
在项目评估以后,电力公司决定全面采用云原生技术构建内部 IT 基础设施架构,并基于此打造内部的超融合虚拟化三维设计平台,以及驱动后续的算力灵活调度,满足更多业务挑战。为此,他们对存储有更大规模和更高性能的需求,希望能满足他们对海量素材管理和高效的设计效率要求。
从业务角度分析,某电力公司变电站三维设计流程包含从设计、诸元管理、仿真等过程,严格执行国家各项制度标准,全面实现智能化转型。
变电站设计流程举例:
三维精细化设计
仿真验证物理模型
全套专业计算与校核
生成全专业施工图
数字化移交成果
在设计过程中,电力公司变电站工程三维设计平台的 GPU 云桌面系统,承载着大量的设计系统软件,如 AutoCAD、道亨、博超等。其中,包含通过大量调度 GPU、CPU 资源,实现集群计算的效果。
同时,电力公司还需要利用到海量结构化数据和非结构化数据,比如工程文件、视频、图片等原始素材和成果,将作为素材进行模型构建和验证工作。在此期间,它们需要流畅的加载和操作,以及兼顾高效率的渲染。因此,整个项目对存储提出了高性能、高可靠、高灵活性的要求,并且需要满足大规模算力并发访问。
此次建设要求采用计算云原生架构,满足当前及未来技术架构演进,具备一定的升级技术基础,实现可持续发展的技术路线。
云原生虚拟化技术基于 Kubevirt,虚拟机的磁盘依赖 Kubernetes 的 PV&PVC 机制分配,故要求存储方案必须支持 Kubernetes 的 CSI 标准插件;
高性能 3D 桌面需要给虚拟机直通 GPU 显卡,要求平台支持 GPU 调度能力;
存储需要支持 RWX 等多种读写访问方式,以支持虚拟机的迁移功能;
计算、存储和 GPU 节点进行融合部署;
存储可支持大量计算并发访问。
综上所述,此次建设需要使用容器计算平台,可灵活调度 GPU 等算力资源,且存储具备对接云原生架构能力,对于海量混合文件管理优化能力。
灵活、高效、高性能,缺一不可的数据平台
在经过详细沟通和多次测试验证后,本次项目采用秒云 GPU 云桌面和焱融 YRCloudFile 分布式并行文件存储作为核心 IT 基础,通过容器化计算资源实现计算资源灵活适用,并通过 CSI 接口对接 YRCloudFile 分布式并行文件存储。
在设计过程中,海量素材和过程数据存放在 YRCloudFile 系统里,使用于三维模型生成、力学验证、成果转化、施工图管理等环节,实现了高效率运行,并且计算和存储采用了分布可扩展架构,计算和存储可按需分布扩容,且具备节点级容错能力,保障业务连续性。
秒云容器云平台基于 Kubernetes 为核心底座,实现集群管理、多租户管理、Linux 和 Windows 应用全生命周期管理、容器和虚拟机统一管理、共享 GPU 调度、CI/CD、微服务治理等功能和服务。采用 GPU 直通技术,最大化利用 GPU 算力资源,避免算力资源浪费。
作为数据的核心层,焱融 YRCloudFile 具备海量结构化和非结构化数据管理能力,海量小文件操作和大文件处理的能力。同时采用 CSI 接口将存储服务能力提供给上层的秒云容器计算集群,实现 PV&PVC、RWX 等多种读写访问方式、QoS、配额管理等服务。
大文件的随机读写、小文件的读写性能;
海量元数据的操作性能(creation、stat、removal 等);
海量文件的支持,以及在海量文件的背景下,数据访问和操作性能保持一致;
存储平台的稳定性;
在故障场景中,尤其是在元数据服务故障场景下,集群性能的稳定性;
与容器平台的对接能力;
数据生命周期的管理。
完美适配客户使用的专业设计软件 AutoCAD、道亨、博超等,运行在秒云计算平台,使用 GPU、CPU 资源进行设计工作,所有数据存储在焱融 YRCloudFile 分布式存储中,实现整体业务数据的全生命周期管理,提升业务完整度和效率。
得益于秒云 & 焱融结合成熟的方案,为用户提供了高性能的基于容器的 GPU 云桌面平台和分布式存储架构,降低投入成本,实现了资源的自动化调度和使用,方案具备良好的业务适配性和性能。
整体方案架构采用了云原生架构,完成了客户此次 IT 基础平台的革新,并留有良好的扩展接口,满足未来业务发展的扩展要求,尤其是在业务快速发展的背景下,数据量快速增长,存储可确保性能稳定,且具备良好的混合数据管理能力。
在工业发展的进程中,各类流程设计应用系统和各类实体设计软件成为主要代表,其中主流设计软件包括 3Dmax、pro-E、solidworks、Rhino、cinema4D、VRay 等,运行此类应用软件需要一个套高效能的 IT 基础平台,大量工业工程建设需要设计、仿真计算工序,在计算方式上大规模采用 GPU 和 CPU 布局,采用集群计算的方式,通过将海量生成贴图和矢量信息绘制成为 2D/3D 设计模型,在此应用模式下,需要满足非结构化和结构化数据混合的存储支撑,尤其是在建模过程中,海量文件应用管理成为主流。
这一解决方案和技术对电网、能源等行业的设计规划业务是一次重要创新,解决了用户对 GPU 设计平台更高效利用,以及高性能数据访问的实际问题。同时秒云容器云平台也作为统一云原生技术平台,除了支撑上述场景外,也为客户业务向云原生数字化转型提供有力支撑,享受云原生技术带来的红利。
此次解决方案和技术不仅解决了企业对 GPU 设计平台利用率和高性能存储的实际问题,更是对电网、能源等工业行业的设计规划业务是一次重要创新。当前,工业设计过程正在向计算密集型和存储 IO 密集型发展,只有全方位支撑业务层的各种设计仿真应用软件,才能为整体业务生命周期提效,保障业务可靠运行。计算能力更趋向于灵活特性,而存储更加趋向于海量高性能特性,焱融科技在工业化设施领域抢抓机遇、主动作为,加快加力推动 IT 基础设施建设,不断提高企业数据承载能力、增强发展后力,为打造企业正向发展提供强有力支撑。
关于焱融
焱融科技成立于 2016 年,总部位于北京,是一家以软件定义存储技术为核心竞争力的高新技术企业,在分布式存储等关键技术上拥有自主知识产权,是高性能文件存储和容器存储的领导者。公司研发团队来自 IBM、VMware、华为、阿里云、美团云、金山云等知名企业,在云计算、分布式存储等核心技术领域积累了多年的开发、实施、运维经验,拥有多项技术专利和软件著作权。焱融科技秉持技术开放共赢的理念联合上下游合作伙伴积极构建完善的 SDS 生态体系,通过不断的技术创新,为用户提供在混合云时代的数据基础设施的架构革新。
关于秒云
MiaoYun 秒云(成都元来云志科技有限公司)于 2019 年成立,以"让人人都能轻松成为云原生运维高手!"的公司定位和产品设计目标,为云原生系统提供更智能的监控运维,更简单的容器云管理,更全面的可观测性,最大化程度的降低企业进入云原生系统的运维难度,赋能传统企业数字化升级转型。
秒云针对中国企业进行了深度定制,全面适配信创体系,支持国产化设备和 x86 混合部署场景。自成立以来,凭借过硬的产品实力,已成功应用于运营商、教育、电力、金融、工业制造、政府、公安等多个行业标杆企业。
版权声明: 本文为 InfoQ 作者【焱融科技】的原创文章。
原文链接:【http://xie.infoq.cn/article/0f35722880be67729d9ceff5b】。文章转载请联系作者。
评论