最新 最热

Impala配置Ranger服务进行权限控制

Impala目前在新版本3.4中提供了Sentry和Ranger的2种权限管控,我们这里分别介绍一下最新的使用,这里跟2.12.0的版本有所不同。

2022-05-20
1

Impala元数据性能改善(3.3版本)

本文介绍了Impala在3.3版本对元数据性能方面做的一些优化和改善,主要结合官方的文档和测试结果进行说明。

2022-05-20
1

Impala tests构造以及执行

Impala提供了一套比较完整的测试用例,包括FE和BE端的都有,但是要把所有的测试用例都跑通,需要启动相应的依赖服务,包括HDFS、Kudu、HBase、Hive等,最后还需要启动一套impala集群,耗费时间比较久,同时对环境也有一定要求,笔者...

2022-05-20
1

使用beeline命令行访问Impala集群

Impala本身提供了两种接口进行访问:beeswax和hs2,其中beeswax是impala自己开发的api,而hs2是兼容hive的。由于beesswax的连接方式需要使用impala自己提供的python脚本,而且不支持HA,因此这里就不再多做介绍。本文主要介绍...

2022-05-20
1

Java代码连接带kerberos的Impala集群

目前impala的认证方式支持两种:用户名密码和kerberos,由于impala的表数据一般是存在HDFS上的,所以很多时候,impala集群也会开启kerberos的认证,初次新接入Impala的小伙伴,可能会对kerberos比较头疼,这里将通过一个简单的例子...

2022-05-20
1

Kylin Cube构建过程优化

原文地址:https://kylin.apache.org/docs16/howto/howto_optimize_build.html

2022-05-20
1

Flink Catalog

Catalog 提供了元数据信息,例如数据库、表、分区、视图以及数据库或其他外部系统中存储的函数和信息。

2022-05-19
1

No FileSystem for scheme "s3"问题解决

公司使用s3的路径去关联hive的分区,现在接入spark on k8s引入了3.0以上的hadoop版本,高版本的hadoop版本开始支持s3a配置。

2022-05-19
1

如何用SQL实现用户行为漏斗分析

1 每日活跃设备明细 dwd_start_log--->dws_uv_detail_day

2022-05-19
1

基于 Iceberg 拓展 Doris 数据湖能力的实践

6月 26 号,由示说网主办,上海白玉兰开源开放研究院、云启资本、开源社联合主办的上海开源大数据技术 Meetup 如期举行。Apache Doris 社区受邀参与本次 Meetup ,来自百度的资深研发工程师 张文歆 为大家带来了题为“ 基...

2022-05-18
1