最新 最热

报告解读下载 | 2022年4月中国数据库行业分析报告

编者: 文中提及的报告,关注 “数据和云” 回复:下载。可以找到链接。 本文源自墨天轮发布的《2022年4月中国数据库行业分析报告》,报告分析了一个阶段数据库行业的大事件,以及行业变化。 关键结论: 墨天轮数据库流行度排...

2022-04-21
0

ZooKeeper在HBase集群中的作用

ZooKeeper作为分布式协调组件,在大数据领域的其他分布式组件中往往扮演着重要的辅助角色,因此我们就算不单独去研究ZooKeeper,也短不了要接触它。本文就以最典型的HBase为例,简要介绍ZooKeeper为HBase提供了哪些功能。...

2022-04-20
1

变革前奏:未来十年属于哪些开发者?| DIVE

4 月 15 日上午,InfoQ 主办的 DIVE 全球基础软件创新大会正式召开,本届大会通过云上展厅的形式进行,历时两天设置了 1 个主会场和 15 个分会场,议题包括开源布道与生态建设、数据库核心技术探讨、操作系统研发实践、面向...

2022-04-19
0

如何提升 HBase 大规模集群下的低延时性能

HubSpot 的数据基础设施团队,每天都要处理 2.5PB 以上的低延迟流量,他们亲眼目睹了 Locality 对于 HBase 的性能有多么重要。请继续阅读,以了解更多关于这些问题:什么是 Locality ,为什么如此重要,以及我们如何在不断增长的...

2022-04-19
1

HBase调优及优化的20种方式(上)

默认情况下,AutoFlush是开启的,当每次put操作的时候,都会提交到HBase server,大数据量put的时候会造成大量的网络IO,耗费性能

2022-04-18
1

Kylin云端跨集群迁移实践

“ 本文介绍在云端kylin数据迁移的实现方案以及在迁移过程中的遇到哪些问题,并给出了问题解决方案.本次迁移中涉及到的hbase cube表1600+,model数量80+,project 10+”...

2022-04-18
1

再谈:分库分表的那些事

在考虑分库分表之前,我们先来探讨下分库分表是解决什么问题的一类技术。从大的方向上看,分库分表是解决两类问题:一是资源承载问题,二是开发架构问题。...

2022-04-18
1

Apache Kylin原理与架构

Apache Kylin是一个开源的大数据分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力(可以把Kylin定义为OLAP on Hadoop)。Apache Kylin于2015年11月正式毕业成为Apache基金会(ASF) 顶级项目,是第一个由中国团...

2022-04-18
1

数仓设计的几点原则

高内聚、低耦合是软件设计的常见概念,特别是在软件模块划分中会被常常提起,需要将功能相同的内聚在一起,将职责不同的功能解耦, 比喻说常见的MVC 分层模式,每一层负责单独的功能。高内聚、低耦合可以使得软件模块职责划分...

2022-04-18
1

flink维表关联系列之Hbase维表关联:LRU策略

维表关联系列目录:一、维表服务与Flink异步IO二、Mysql维表关联:全量加载三、Hbase维表关联:LRU策略四、Redis维表关联:实时查询五、kafka维表关联:广播方式六、自定义异步查询...

2022-04-18
1