Apache Hue 介绍

2021-01-26 10:48:28 浏览数 (1)

本篇博客小菌为大家带来的是关于Apache Hue 的介绍!

1.Hue是什么

HUE=Hadoop User Experience

Hue是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。

通过使用Hue,可以在浏览器端的Web控制台上与Hadoop集群进行交互,来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览HBase数据库等等。

2.Hue能做什么

访问HDFS和文件浏览

通过web调试和开发hive以及数据结果展示

查询solr和结果展示,报表生成

通过web调试和开发impala交互式SQL Query

spark调试和开发

Pig开发和调试

oozie任务的开发,监控,和工作流协调调度

Hbase数据查询和修改,数据展示

Hive的元数据(metastore)查询

MapReduce任务进度查看,日志追踪

创建和提交MapReduce,Streaming,Java job任务

Sqoop2的开发和调试

Zookeeper的浏览和编辑

另外,Hue 还支持 数据库(MySQL,PostGres,SQlite,Oracle)的查询和展示

例如:

3.Hue的架构

Hue是一个友好的界面集成框架,可以集成各种大量的大数据体系软件框架,通过一个界面就可以做到查看以及执行所有的框架。

Hue提供的这些功能相比Hadoop生态各组件提供的界面更加友好,但是一些需要debug的场景可能还是要使用原生系统才能更加深入的找到错误的原因。

因为本篇博客主要为大家介绍Hue的基础知识,关于应用更多停留在的是理论层面。下篇博客,小菌将为大家带来关于Hue的安装及应用,敬请期待!!!

0 人点赞