最新 最热

Apache Kylin 在中通快递的实践

Apache Kylin 在中通是如何落地的,又是怎样赋能中通快递实现 OLAP 分析能力起飞的?本文从多方面对比了 Presto 和 Kylin 的优缺点,并从业务场景、调度整合、监控系统、运维调优、源码和二次开发等多个角度进行了阐述。...

2021-03-05
1

Hbase Bulkload 原理|面试必备

下面假设我们有一个 CSV 文件,是存储用户购买记录的。它一共有三列, order_id,consumer,product。我们需要将这个文件导入到Hbase里,其中 order_id 作为Hbase 的 row key。...

2021-03-05
1

HBase 数据存储结构

在「HBase」中, 从逻辑上来讲数据大概就长这样:单从图中的逻辑模型来看, HBase 和 MySQL 的区别就是:将不同的列归属与同一个列族下支持多版本数据这看着感觉也没有那么太大的区别呀...

2021-03-05
1

HBase 底层原理详解(深度好文,建议收藏)

HBase 是一个分布式的、面向列的开源数据库。建立在 HDFS 之上。Hbase的名字的来源是 Hadoop database,即 Hadoop 数据库。HBase 的计算和存储能力取决于 Hadoop 集群。...

2021-03-04
1

Mysql8.0.22主备GTID Replication中的那些坑

答:全局事务ID,为每一个在Master上提交的事务在集群内Replication时只生成一个唯一的ID,为规避冗余和错误提供了有力保障。

2021-03-03
1

HBase

· 客户端查数据是先查Memstore,再查BlockCache,最后再storefile

2021-03-02
1

Spark笔记9-HBase数据库基础

Hbase是谷歌开源的big table;一个表中包很多的行和列。HBase的底层是保存在HDFS之上的。

2021-03-02
1

使用datax将postgresql或者greenplum中的数据同步到elasticsearch

1、使用datax工具将postgresql或者greenplum数据库中的数据同步到elasticsearch中。DataX目前已经有了比较全面的插件体系,主流的RDBMS数据库、NOSQL、大数据计算系统都已经接入,目前支持数据如下图:...

2021-03-02
1

怎样将数据从Oracle迁移到TiDB

Best Practice for Data migration from Oracleto Tidb

2021-02-19
1

大白话彻底讲透 HBase Rowkey 设计和实现!

大家都知道 HBase 由于它存储和读写的高性能,在 OLAP 即时分析中发挥着非常重要的作用,而 RowKey 作为 HBase 的核心知识点,其设计势必会影响到数据在 HBase 中的分布,甚至会影响我们查询的效率,可以说 RowKey 的设计质量...

2021-02-08
1