最新 最热

Apache Kylin-2.6安装部署

构建过程是一个MapReduce任务,比较耗时,构建之前确保MapReduce History Server是启动的,否则会报错

2021-04-13
1

大数据知识点杂记

ⅲ、重新创建表,在表创建时会自动挂载该协处理器(表在挂载协处理器的时候,回去HBase的根目录下的lib文件夹下面找到jar包)

2021-04-13
1

大数据治理——搭建大数据探索平台

在数据治理中,数据探索服务的价值在初期往往是被忽视的,但是随着业务的增加,分析人员的增加,数据探索服务的价值就会越来越大。

2021-04-13
1

Apache Hudi在医疗大数据中的应用

本篇文章主要介绍Apache Hudi在医疗大数据中的应用,主要分为5个部分进行介绍:1. 建设背景,2. 为什么选择Hudi,3. Hudi数据同步,4. 存储类型选择及查询优化,5. 未来发展与思考。...

2021-04-13
1

安装Apache Hbase 1.1.1(搭建kylin必要的操作)

链接:https://pan.baidu.com/s/1vc7i9JO87WiKUk_ce0J7KQ 提取码:rsgx

2021-04-13
1

Apache Hudi索引实现分析(三)之HBaseIndex

前面分析了基于过滤器的索引,接着分析基于外部存储系统的索引实现:HBaseIndex。对于想自定义实现Index具有一定的借鉴作用。

2021-04-13
1

HBase的java代码开发(详细代码)

与SingleColumnValueFilter相反,会排除掉指定的列,其他的列全部返回

2021-04-13
1

Hbase篇之面试题

​ hbase.regionserver.global.memstore.size: 默认;堆大小的40%

2021-04-13
1

Hbase详细安装步骤(Hbase入门第二篇)

HBase的集群环境搭建注意事项:HBase强依赖zookeeper和hadoop,安装HBase之前一定要保证zookeeper和hadoop启动成功,且服务正常运行第一步:下载对应的HBase的安装包所有关于CDH版本的软件包下载地址如下http://archive.clou...

2021-04-13
1

ApacheHudi使用问题汇总(一)

通常,你会从源获取部分更新/插入,然后对Hudi数据集执行写入操作。如果从其他标准来源(如Kafka或tailf DFS)中提取数据,那么DeltaStreamer将会非常有用,其提供了一种简单的自我管理解决方案,可将数据写入Hudi。你还可以自己编...

2021-04-13
1