最新 最热

06-PDI(Kettle)读取Hive写入HDFS,读取HDFS写入HBase中

本文主要通过Kettle完成对Hive和HBase中数据的读写工作,为了便于按照文档即可实现Kettle的读写Hive和HBase,文本前面也介绍下Hive的安装过程,如何Hive已经完成安装,可跳过前面即可。 实验环境: cetnos7.4...

2022-11-12
2

Atlas 高可用部署

https://github.com/apache/atlas  (github 拉取对应分支代码)

2022-11-10
2

Hbase 整理

{row, column, version}元组就是一个HBase中的一个 cell。

2022-11-10
2

impala简介

Impala是用于处理存储在Hadoop集群中的大量数据的MPP(大规模并行处理)SQL查询引擎。 它是一个用C ++和Java编写的开源软件。 与其他Hadoop的SQL引擎相比,它提供了高性能和低延迟。...

2022-11-10
2

ODS概念总结_ODS系统

DB(Database)数据库 ODS(Operational Data Store)运营数据存储 DW(Data Warehouse)数据仓储 DM(Data Market)数据集市

2022-11-09
1

跨数据库同步方案汇总怎么做_国内外数据库同步方案

Datax 一般比较适合于全量数据同步,对全量数据同步效率很高(任务可以拆分,并发同步,所以效率高),对于增量数据同步支持的不太好(可以依靠时间戳+定时调度来实现,但是不能做到实时,延迟较大)。...

2022-11-07
2

大数据-数据中台搭建技术选型

文档:https://dtstack.github.io/Taier/docs/guides/introduction/

2022-11-03
1

安装redis和tsdb

tsdb的版本一定要选对,hbase是2.0.0的就选2.3.1及以上的,否则版本不匹配

2022-11-02
2

安装Standalone模式HBase

所谓Standalone模式HBase,就是只启动一个JVM进程,在这个进程中同时启动了多个后台角色,如:HMaster,单个HRegionServer,以及ZooKeeper服务。

2022-10-28
2

大白话之时序数据库入门篇

今天简单带大家了解一下时序数据库。聊聊什么是时序数据库,有什么特点,用在什么场景,和传统关系型数据库的区别与联系,以及开源解决方案调研。...

2022-10-28
1