写点什么

Apache Hue 介绍

发布于: 2021 年 05 月 10 日
Apache Hue介绍

1. Hue 是什么

HUE=HadoopUser Experience

Hue 是一个开源的 Apache Hadoop UI 系统,由 Cloudera Desktop 演化而来,最后 Cloudera 公司将其贡献给 Apache 基金会的 Hadoop 社区,它是基于 Python Web 框架 Django 实现的。

通过使用 Hue,可以在浏览器端的 Web 控制台上与 Hadoop 集群进行交互,来分析处理数据,例如操作 HDFS 上的数据,运行 MapReduce Job,执行 Hive 的 SQL 语句,浏览 HBase 数据库等等。

2. Hue 能做什么

访问 HDFS 和文件浏览

通过 web 调试和开发 hive 以及数据结果展示

查询 solr 和结果展示,报表生成

通过 web 调试和开发 impala 交互式 SQLQuery

spark 调试和开发

Pig 开发和调试

oozie 任务的开发,监控,和工作流协调调度

Hbase 数据查询和修改,数据展示

Hive 的元数据(metastore)查询

MapReduce 任务进度查看,日志追踪

创建和提交 MapReduce,Streaming,Javajob 任务

Sqoop2 的开发和调试

Zookeeper 的浏览和编辑

数据库(MySQL,PostGres,SQlite,Oracle)的查询和展示



3. Hue 的架构

Hue 是一个友好的界面集成框架,可以集成各种大量的大数据体系软件框架,通过一个界面就可以做到查看以及执行所有的框架。

Hue 提供的这些功能相比 Hadoop 生态各组件提供的界面更加友好,但是一些需要 debug 的场景可能还是要使用原生系统才能更加深入的找到错误的原因。


发布于: 2021 年 05 月 10 日阅读数: 16
用户头像

还未添加个人签名 2021.03.07 加入

还未添加个人简介

评论

发布
暂无评论
Apache Hue介绍