本篇博客小菌为大家带来的是关于Apache Hue 的介绍!
1.Hue是什么
HUE=Hadoop User Experience
Hue是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。
通过使用Hue,可以在浏览器端的Web控制台上与Hadoop集群进行交互,来分析处理数据,例如操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览HBase数据库等等。
2.Hue能做什么
访问HDFS和文件浏览
通过web调试和开发hive以及数据结果展示
查询solr和结果展示,报表生成
通过web调试和开发impala交互式SQL Query
spark调试和开发
Pig开发和调试
oozie任务的开发,监控,和工作流协调调度
Hbase数据查询和修改,数据展示
Hive的元数据(metastore)查询
MapReduce任务进度查看,日志追踪
创建和提交MapReduce,Streaming,Java job任务
Sqoop2的开发和调试
Zookeeper的浏览和编辑
另外,Hue 还支持 数据库(MySQL,PostGres,SQlite,Oracle)的查询和展示
例如:
3.Hue的架构
Hue是一个友好的界面集成框架,可以集成各种大量的大数据体系软件框架,通过一个界面就可以做到查看以及执行所有的框架。
Hue提供的这些功能相比Hadoop生态各组件提供的界面更加友好,但是一些需要debug的场景可能还是要使用原生系统才能更加深入的找到错误的原因。
因为本篇博客主要为大家介绍Hue的基础知识,关于应用更多停留在的是理论层面。下篇博客,小菌将为大家带来关于Hue的安装及应用,敬请期待!!!