最新 最热

快速学习-Kylin Cube构建优化

从之前章节的介绍可以知道,在没有采取任何优化措施的情况下,Kylin会对每一种维度的组合进行预计算,每种维度的组合的预计算结果被称为Cuboid。假设有4个维度,我们最终会有24 =16个Cuboid需要计算。...

2020-03-24
1

快速学习-Kylin环境搭建

1)将apache-kylin-2.5.1-bin-hbase1x.tar.gz上传到Linux 2)解压apache-kylin-2.5.1-bin-hbase1x.tar.gz到/opt/module

2020-03-24
1

Hbase FAQ热门问答小集合

问:Hbase大量写入很慢,一个列族,每个200多列,一秒写30000条数据,使用mutate添加数据,clientbuffer缓存大小为10M,四台测试机,128G内存,分配60G给Hbase,该怎么优化?...

2020-03-18
1

在CDH 6.3中安装Phoenix服务

三、在Cloudera Manager中添加Phoenix服务(前提是已经安装了HBase服务)

2020-03-18
1

HBase 性能调优第一弹:内存篇

这是使用 HBase 最不可避免的一个话题,就是 HBase 的性能调优,而且通常建立在我们对 HBase 内部运行机制比较了解的基础上进行的,因此无论怎么说,调优这块都是一个相对复杂的事情。这一篇我们先来介绍与 HBase 内存最相关...

2020-03-13
1

从原理到参数解析,HBase 刷写与合并机制介绍

HBase 是目前主流的 NoSQL 数据库,是一个高可靠、高性能、高伸缩的分布式 KV 存储系统,本文讲解 HBase 两个核心机制——刷写(Flush)与合并(Compaction),重点介绍其原理及参数配置建议。...

2020-03-13
1

HBase 性能测试之读写P999延时压测实践

我们在使用HBase的时候,必须要能够清楚HBase服务端的性能,这对HBase的合理使用以及性能调优都非常重要,所以一般在使用HBase之前,建议做一些必要的基准性能测试,其中,读写P99/P999延时就是一项衡量HBase性能的关键指标。本...

2020-03-13
1

一文读懂 HBase 核心原理与应用场景

HBase是大数据NoSQL领域里非常重要的分布式KV数据库,是一个高可靠、高性能、高伸缩的分布式存储系统,目前国内知名公司都有在大规模使用,社区也非常活跃。本文就是学习HBase的敲门砖,主要从以下几个方面解读HBase。...

2020-03-13
1

大数据领域里的独行侠-Dynamo风格数据库

上篇文章聊了下 Hbase ,这篇聊一下 Hbase 的“孪生兄弟”Dynamo风格的数据库,比如 Riak 、Cassandra。在大数据领域混的人大概都知道谷歌发表的 BigTable 的论文,但是对亚马逊的 Dynamo 论文就不太清楚了。当然这也有可...

2020-03-13
1

HBase 基本入门篇

无论是 NoSQL,还是大数据领域,HBase 都是非常"炙热"的一门数据库。本文将对 HBase 做一些基础性的介绍,旨在入门。

2020-03-12
1