hive_字节宝

Impala配置Ranger服务进行权限控制

Impala目前在新版本3.4中提供了Sentry和Ranger的2种权限管控，我们这里分别介绍一下最新的使用，这里跟2.12.0的版本有所不同。

hive xml 腾讯云测试服务 shell 网站

2022-05-20

Impala元数据性能改善（3.3版本）

本文介绍了Impala在3.3版本对元数据性能方面做的一些优化和改善，主要结合官方的文档和测试结果进行说明。

缓存 hive spark 数据库 SQL

2022-05-20

Impala tests构造以及执行

Impala提供了一套比较完整的测试用例，包括FE和BE端的都有，但是要把所有的测试用例都跑通，需要启动相应的依赖服务，包括HDFS、Kudu、HBase、Hive等，最后还需要启动一套impala集群，耗费时间比较久，同时对环境也有一定要求，笔者...

Node.js 大数据打包 postgresql hive

2022-05-20

使用beeline命令行访问Impala集群

Impala本身提供了两种接口进行访问：beeswax和hs2，其中beeswax是impala自己开发的api，而hs2是兼容hive的。由于beesswax的连接方式需要使用impala自己提供的python脚本，而且不支持HA，因此这里就不再多做介绍。本文主要介绍...

hadoop hive kerberos jdk Java

2022-05-20

Java代码连接带kerberos的Impala集群

目前impala的认证方式支持两种：用户名密码和kerberos，由于impala的表数据一般是存在HDFS上的，所以很多时候，impala集群也会开启kerberos的认证，初次新接入Impala的小伙伴，可能会对kerberos比较头疼，这里将通过一个简单的例子...

kerberos 大数据 hive

2022-05-20

Kylin Cube构建过程优化

原文地址：https://kylin.apache.org/docs16/howto/howto_optimize_build.html

hive hbase TDSQLMySQL版编程算法

2022-05-20

Flink Catalog

Catalog 提供了元数据信息，例如数据库、表、分区、视图以及数据库或其他外部系统中存储的函数和信息。

hive jdbc flink api 大数据

2022-05-19

No FileSystem for scheme "s3"问题解决

公司使用s3的路径去关联hive的分区，现在接入spark on k8s引入了3.0以上的hadoop版本，高版本的hadoop版本开始支持s3a配置。

spark hive kubernetes 文件存储spark s3 NoFileSystem s3a FileSystem

2022-05-19

如何用SQL实现用户行为漏斗分析

1 每日活跃设备明细 dwd_start_log--->dws_uv_detail_day

bash bash指令 hadoop hive

2022-05-19

基于 Iceberg 拓展 Doris 数据湖能力的实践

6月 26 号，由示说网主办，上海白玉兰开源开放研究院、云启资本、开源社联合主办的上海开源大数据技术 Meetup 如期举行。Apache Doris 社区受邀参与本次 Meetup ，来自百度的资深研发工程师张文歆为大家带来了题为“ 基...

数据湖数据集成大数据编程算法 hive

2022-05-18

48 49 50 51 52

Impala配置Ranger服务进行权限控制

Impala元数据性能改善（3.3版本）

Impala tests构造以及执行

使用beeline命令行访问Impala集群

Java代码连接带kerberos的Impala集群

Kylin Cube构建过程优化

Flink Catalog

No FileSystem for scheme "s3"问题解决

如何用SQL实现用户行为漏斗分析

基于 Iceberg 拓展 Doris 数据湖能力的实践

热门文章

热门手册