最新 最热

Kylin独立HBase集群部署常见问题汇总

Kylin在部署的以后需要依赖Hadoop,Hive以及HBase等组件,最近公司内部在部署Kylin服务的时候遇到了不少问题。主要是HBase集群是独立部署的,与Kylin部署的HDFS不是同一个,因此踩了许多坑,这里将遇到的一些问题记录下来,希望...

2022-05-20
1

Apache Kylin存储和查询的分片问题

为了了解Kylin存储和查询的分片问题,需要先介绍两个重要概念:segment和cuboid。相信大数据行业的相关同学都不陌生。Kylin每次提交一个新的build任务都会生成一个新的segment,而用户一般都是每天构建一次。那么,这种情况...

2022-05-20
1

Kylin Cube构建过程优化

原文地址:https://kylin.apache.org/docs16/howto/howto_optimize_build.html

2022-05-20
1

Dinky 扩展 Phoenix 连接器使用分享

摘要:本文介绍了在 Dinky 中扩展 Phoenix 的 Flink 连接器使用分享。内容包括:

2022-05-19
1

【万字长文】Hbase最全知识点整理(建议收藏)

Zookeeper: Master 的高可用、RegionServer 的监控、元数据的入口以及集群配置的维护等

2022-05-17
1

Hbase 数据迁移闭坑指南

HBase自身也提供了ExportSnapshot的方法可以从HDFS文件层基于某个快照快速的导出HBase的数据,并不会对RegionServer造成影响,但该源生的方法不支持增量。

2022-05-17
1

《用户画像:方法论与工程化解决方案》读书笔记第3章

在画像系统搭建的过程中,数据存储的技术选型是非常重要的一项内容,不同的存储方式适用于不同的应用场景。本章主要介绍使用Hive、MySQL、HBase、Elasticsearch存储画像相关数据的应用场景及对应的解决方案。...

2022-05-13
1

BloomFilter布隆过滤器

位数组与Hash函数的联合使用。是一个包含m位的位数组,每位初始化为0,有k个不同的Hash函数,可将集合元素映射到位数组的某一位。插入元素需根据k个hash函数得到k个位,置为1。查询时判断这k个位(有0则该元素肯定不在集合中,都...

2022-05-13
1

Kylin的入门实战

1.Kylin 是一款大数据OLAP引擎,由ebay-中国团队研发的,是第一个真正由中国人自己主导、从零开始、自主研发、并成为Apache顶级开源项目

2022-05-12
1

杨校老师课堂之分布式数据库HBase的部署和基本操作

(1) 安装JDK、Hadoop,这里采用的JDK1.8,Hadoop2.7.4,CentOS7.6

2022-05-11
1