带你快速上手 HetuEngine
本文分享自华为云社区《【手把手带你玩转HetuEngine】(一)HetuEngine快速上手》,作者:HetuEngine 九级代言。
HetuEngine 是什么
HetuEngine 是华为推出的高性能交互式 SQL 分析及数据虚拟化引擎。与大数据生态无缝融合,实现海量数据秒级交互式查询;支持跨源跨域统一访问,使能数据湖内、湖间、湖仓一站式 SQL 融合分析。
HetuEngine 适合做什么
适用于 Hadoop 集群(FusionInsight MRS)的 Hive、Hudi 数据源的交互式快速查询场景;
适用于跨源(多种数据源,如 Hive,Hudi,HBase,GaussDB(DWS),Elasticsearch,ClickHouse 等)查询;
适用于跨域(多个地域或数据中心)的快速联合查询;
不擅长大批量、复杂逻辑的跑批处理、创建事务、数据入库操作等。
HetuEngine 特点
HetuEngine 基本架构
HetuEngine 面向企业级能力方面,构建了极致稳定、高性能的企业级交互式分析引擎。
云服务层:提供了企业级的运维管理监控能力,认证与业务接入统一访问入口,友好的可视化界面操作,一键式参数调优和配置,协助用户轻松简单的管理集群平台;
引擎层:纯计算引擎部署,与数据解耦;自容错,节点故障级别重启,内存溢出保护等;计算实例基于任务负载自动弹性伸缩,可水平横向扩展;
数据层:支持多种常见的数据源间的联合查询,同时计算和数据解耦,天然的存算分离架构。
HetuEngine 服务角色
HeuEngine 引擎架构
HetuEngine 引擎执行流程简单介绍:
Coordinator
负责管理 Worker 节点,以及接受客户端查询请求,并进行 SQL 的语法解析(Parser)、执行计划生成与优化(Plannner)和查询任务的调度(Scheduler)
Worker
负责具体的查询计算和数据读写
Discovery Server
负责发现集群的各个节点,用于节点间心跳监控
快速上手指南
工欲善其事必先利其器,在使用 HetuEngine 之前,首先需要了解基本的架构,并与业务场景相结合,然后进行集群相关的规划和配置,最后进行业务对接和验证上线。本系列将从以下几方面内容手把手带你玩转 HetuEngine。
了解 HetuEngine 的基本架构:了解 HetuEngine 是什么
了解 HetuEngine 常见的应用场景,与业务场景相结合:判断 HetuEngine 是否适应于业务场景
集群部署和资源规划:前期的资源规划必不可少
数据源添加和管理:对接业务需要的数据源
权限管控和配置:保障不同业务用户之间的权限管控
业务对接:业务对接和验证
性能调优:不同的调优手段
运行过程中常见问题排查:常见问题的处理方式
版权声明: 本文为 InfoQ 作者【华为云开发者联盟】的原创文章。
原文链接:【http://xie.infoq.cn/article/34efce1a93e8c097bff4b33e0】。文章转载请联系作者。
评论