中国石油数字化转型提速 HashData 助力梦想云建设
近期,HashData 助力中油瑞飞共同构建了中国石油梦想云平台。其中梦想云数据湖集中管理了中国石油历史勘探开发、生产经营等 6 大领域及物探钻井等 15 个专业的数据,涵盖结构化、非结构化等 8 类数据,总量达 5PB。真正实现了海量数据入湖、治理、共享、分析等功能。
背景
北京中油瑞飞信息技术有限责任公司(简称“中油瑞飞”) 是中国石油集团东方地球物理勘探有限责任公司的全资子公司, 与多家国内外著名 IT 公司建立了战略合作伙伴关系。此次,HashData 携手中油瑞飞共同研发国产数据仓库,支持梦想云数据湖和区域湖建设,加快助力油田数字化转型。
趋势在即,业务难协同
在过去 35 年里,中国石油的信息化建设历经了分散建设、集中建设、集成应用三个阶段,石油信息人一直致力于数据库及深化应用的建设。然而,受技术的限制,一直没有统一的技术平台。数据多头录入、标准不统一、功能重复开发、数据流与业务流分离,数据库多、平台多、孤立应用多的“三多”现象日趋突出,部分油田公司的统建、自建系统多达上百个,接口上千个,数据无法共享、业务无法协同。
HashData 技术解决方案:数据湖即服务
计算存储分离
如上架构图可见,HashData 云端数据湖采用了计算存储分离的架构, 数据存放到对象存储上。计算层采用基于 Greenplum 内核的 MPP 计算引擎,支持动态扩容等特性,使计算资源配置更灵活。当需要少量计算时,用户可以启动小集群,最快 5 分钟部署一套集群,无需专业技术人员维护;当计算量增加时,最快可以在 3 分钟内对集群进行扩容。相对于计算存储绑定的架构,HashData 云端数据湖在保证查询需求的同时,减少了服务器资源成本。在 PB 级的数据量下,可以节省上百万的服务器采购成本。
完全托管
此外,HashData 提供完整的自动化部署、监控和管理界面,大大缩短项目实施的周期,降低了运维人员工作量。同时支持数据在线备份与恢复,多种数据复制方式,增量备份与恢复。当服务器出现单点故障时,业务可以快速切换到其它服务器,通过集群间数据复制等方式支持容灾。在运维管理上,提供界面化的资源管理功能,能将用户划分入不同的资源级别,具备丰富的调度功能,确保企业数据安全。
扩展更弹性
HashData 使用的多种创新技术,帮助企业以较低成本实现了数据管理。只需单个 100GB 节点即可以开始运行。随着业务的发展,当数据量增大到 PB 级,利用 HashData 控制台能够轻松完成扩展到 1PB 或更多用户数据。
低成本实现数据共享,提升业务协同
HashData 通过利用云计算技术构建数据湖服务替代传统软件模式,实现了总部统一管理,各个数据湖共享数据的目标。为勘探开发研究人员和决策人员搭建了一体化的协同工作环境,支撑跨盆地、跨油气田企业的数据共享、成果继承及专业软件云化管理和整合应用。
小结
梦想云平台融合了国际最新 IT 技术,在上游业务领域中率先建成了具有自主知识产权的 PaaS 私有云平台,有效支持油气勘探、油气开发、协同研究、生产运行、经营管理、安全环保、工程技术、数字政务八大业务应用。未来,在此基础之上,HashData 将继续参与梦想云平台新功能的建设。
版权声明: 本文为 InfoQ 作者【HashData】的原创文章。
原文链接:【http://xie.infoq.cn/article/a9df37be7912cc76e7c75ef31】。文章转载请联系作者。
评论