最新 最热

HBase最佳实践 | 合理的Region数量与大小

通常较少的region数量可使群集运行的更加平稳,官方指出每个RegionServer大约100个regions的时候效果最好,理由如下:

2020-04-25
1

0762-5.16.2-Impala查询HBase表字段顺序不正确异常分析

按照官方文档在Hive中建表关联HBase,然后在Hue中用Impala查询,查询结果中字段的顺序与在Hive中的建表顺序不一致,Hue中使用Impala查询出来的字段顺序是按照字母排序的。...

2020-04-24
1

HBase原理 | HBase内存管理之MemStore进化论

Java工程中内存管理总是一个绕不过去的知识模块,无论HBase、Flink还是Spark等,如果使用的JVM堆比较大同时对读写延迟等性能有较高要求,一般都会选择自己管理内存,而且一般都会选择使用部分堆外内存。HBase系统中有两块大...

2020-04-22
1

HBase实践 | HBase内核优化与吞吐能力建设

公司的hbase集群早先是基于社区1.2.4版本进行搭建的,在时延表现方面起初并不十分理想,受GC尖刺的影响非常严重,针对P99响应时延也只能给业务提供不高于100毫秒的SLA承诺,因此在公司层面接入hbase的业务普遍还是面向近线或...

2020-04-22
1

HBase调优 | 写入阻塞问题与参数优化

在此过程中,我们经常会遇到写入阻塞问题,表现为数据无法写入,本文我们就来分析可能会引发写入阻塞的几种情况,以及如何尽量避免阻塞问题。

2020-04-22
1

运营数据库系列之管理篇

这篇博客文章是CDP中Cloudera的运营数据库(OpDB)系列文章的一部分。每篇文章都会详细介绍新功能。从该系列的开头开始,请参阅<CDP中的运营数据库>,<运营数据库系列之可访问性>。...

2020-04-21
1

CDP中的运营数据库

CDP 中的 Cloudera 运营数据库( OpDB ) 提供了实时、始终可用的可扩展OpDB,它在统一的运营和仓储平台中为传统结构化数据以及新的非结构化数据提供服务。Cloudera提供了一个可运营的数据库,该数据库在统一的开源平台中为...

2020-04-21
1

推荐系统实践系列 | 一、推荐系统流程设计

推荐系统主要解决的是信息过载问题,目标是从海量物品筛选出不同用户各自喜欢的物品,从而为每个用户提供个性化的推荐。推荐系统往往架设在大规模的业务系统之上,不仅面临着用户的不断增长,物品的不断变化,而且有着全面的推...

2020-04-20
1

图数据库 Nebula Graph 在 HBaseCon Asia2019 的分享实录

HBaseCon Asia2019 活动于 2019 年 7 月 20 日于北京金隅喜来登酒店举办,应主办方邀请,Nebula Graph 技术总监-陈恒在活动中发表演讲 “Nebula: A Graph DB based on HBase” 。本篇文章是根据此次演讲所整理出的技术...

2020-04-16
1

HBSAE-NoSQL 非关系型数据库

每天写入量巨大,而相对读数量较小的应用,不需要复杂查询条件来查询数据的应用,HBase只支持基于rowkey的查询

2020-04-11
1