杉岩数据:基于鲲鹏 DevKit 高效开发产线质检数据智能存储管理平台,破解数据管理难题
云计算、大数据、3D 打印、人工智能、虚拟现实等信息技术的兴起极大激发了数据要素的创新活力,数字化正全面重塑工业格局,作为数据基础设施的核心底座,存储系统对企业数据的保存、使用和挖掘起到了至关重要的作用。
深圳市杉岩数据技术有限公司(以下简称:杉岩数据)以新一代智能分布式存储技术为核心,致力于打造云计算、人工智能、物联网等领域的数据存储基石。其核心产品「产线质检数据智能存储平台」能够为多个生产线设备的图片/日志数据提供统一的采集、存储和管理能力,切实有效解决制造业企业产线海量质检数据存放难、检索慢、管理难、利用难等问题,帮助制造企业实现产线业务的降本增效。
随着数字化转型的深入,企业的 IT 系统建设也进一步加快,一方面带来了数据量的急剧增长,另一方面也提高了数据的访问频率,对存储系统的管理要求也进一步提高:
数据体量大:大量机器设备的高频数据和互联网数据持续涌入,大型工业企业的数据集将达到 PB 级甚至 EB 级别;
低时延:云平台和工厂生产设施的实时通信,海量传感器与人工智能平台的信息交互等都对时延有着极为苛刻的要求,甚至需达到 20ms 以内;
高安全:为满足产品质量的追溯要求,质检图片往往需要保存 2 年以上,一旦个别硬盘损坏,数据无法恢复,存在安全风险。
鲲鹏平台天生的多核多并行能力,能够很好的满足数据量大、高安全和超低时延的要求;此外,提供完善的鲲鹏开发套件 DevKit 以支撑应用的快速迁移、开发和调优。基于上述考虑,杉岩数据选择鲲鹏作为承载「产线质检数据智能存储平台」的数字底座,从而更好的保障业务性能和持续演进。
基于 DevKit 代码迁移工具实现杉岩智能存储管理平台快速迁移
在项目开始阶段,开发人员需要将软件平台快速迁移到鲲鹏。该系统主要由 C 语言开发,代码体量高达数十万,依赖文件较多,经分析采用手动迁移,整个系统预计需要 10 人天才能完成。而鲲鹏 DevKit 代码迁移能力可以实现依赖文件自动识别、兼容包一键下载、代码修改建议一键替换,无须耗时耗力检查跟进。在鲲鹏 DevKit 的帮助下整个系统只用了 4 人天,平均 2 人天/应用完成了迁移。
【鲲鹏 DevKit 代码迁移工具扫描获取迁移报告】
开发 &编译:基于鲲鹏 DevKit 高效开发压缩解压缩模块,开发效率提升 20%
迁移完成之后,开发团队计划在鲲鹏平台上新开发用于对象存储写场景的压缩解压缩模块,以便进行数据的存储和传输。由于原有 X86 平台的开发经验和兼容生态并不能直接复制到鲲鹏平台之上,开发人员在应用开发过程中也遇到了不少问题:对鲲鹏加速库的 API 不熟悉、不知道如何使用,不知道如何对现有程序进行针对鲲鹏处理器的加速优化等。
面对上述挑战,技术人员在开发过程中使用了鲲鹏 DevKit 提供的鲲鹏开发框架、通用计算 SDK 和 GCC for openEuler 进一步提升应用开发效率和性能。首先,通过鲲鹏开发框架快速创建通用计算应用工程,一键部署鲲鹏通用计算 SDK 快速引入鲲鹏硬件加速、鲲鹏加速库等能力,该应用基于 ARM 指令深度优化,为分布式存储压缩等应用场景提供高性能加速,并通过启发式编程智能提示和补全鲲鹏相关函数和编译选项,培养用户的开发习惯。经测试,在 512K workload 下,对象存储-RGW 单节点写测试性能由 1.49GB/s 提升至 1.79GB/s,性能提升 20.13%。
【通过鲲鹏 DevKit 创建鲲鹏通用计算工程】
【通过鲲鹏 DevKit 实现开发效率提升】
此外,技术人员在编译过程中将之前的 GCC 7.3 更换为 GCC for openEuler。GCC for openEuler 提供了针对鲲鹏微架构芯片及指令优化,通过软硬协同相较 GCC 7.3 提供更强的性能,有效提升了编译效率,替换之后,存储产品在鲲鹏平台上的运行性能提升 12%。
当前,杉岩产线质检数据智能存储解决方案已在高端制造、金融、党政、医疗、教育等 10 余个重点行业实现大规模商用部署,累计服务客户 1000+,总交付容量超过 5500PB。作为鲲鹏计算产业生态重要伙伴,杉岩数据将联合深圳鲲鹏产业源头创新中心继续深耕软件定义存储领域,发挥国家级专精特新“小巨人”企业的示范引领作用,为国家数字经济高质量发展贡献新的力量!
鲲鹏 DevKit 也将围绕开发者体验持续升级能力,支持迁移扫描、鲲鹏亲和分析等插件快速接入企业现有开发流水线(如:Jenkins,CodeArts),不改变现有开发流程,开发者可以在流水线中快速扫描、修改、提交代码,更加便捷的发布鲲鹏版本。
【扫码登录鲲鹏社区 DevKit 专区,了解更多】
评论