最新 最热

大数据ClickHouse进阶(二十六):ClickHouse数据备份

在ClickHouse中存在副本,主要作用是保证数据的高可用,副本不能防止数据误删这类操作,ClickHouse提供了多种数据备份的方法来防止数据误删。

2022-11-17
3

大数据ClickHouse进阶(十二):ClickHouse的explain查询执行计划

ClickHouse在版本20.6.3之后支持explain查看执行计划。explain基本语法如下:

2022-09-23
3

大数据ClickHouse进阶(十一):ClickHouse的Join子句

Join子句可以对左右两张表的数据进行连接,join语法包含连接精度和连接类型两部分。参照下图帮助大家理解:

2022-09-22
2

大数据ClickHouse进阶(十):ClickHouse的Array Join子句

Array join 子句允许在数据表的内部,与数组类型的字段进行join操作,从而将一行数组展开为多行。

2022-09-21
3

大数据ClickHouse进阶(九):ClickHouse的From和Sample子句

From子句表示从何处读取数据,支持2种形式,由于From比较简单,这里不再举例,2种使用方式如下:

2022-09-20
3

大数据ClickHouse进阶(八):ClickHouse的with子句

可以访问select子句中的列字段,并调用函数做进一步处理,处理之后的数据可以在select子句中继续使用。

2022-09-19
3

大数据ClickHouse进阶(七):ClickHouse 数据查询

可以从官网下载官网提供的数据集hits_v1和visits_v1,对应的下载路径为:

2022-09-18
3

大数据ClickHouse进阶(六):Distributed引擎深入了解

Distributed引擎和Merge引擎类似,本身不存放数据,功能是在不同的server上把多张相同结构的物理表合并为一张逻辑表。

2022-09-17
3

大数据ClickHouse进阶(四):ClickHouse的索引深入了解

在MergeTree中PRIMARY KEY 主键并不用于去重,而是用于索引,加快查询速度,MergeTree会根据index_granularity间隔(默认8192行),为数据表生成一级索引并保存至primary.idx文件内,索引数据按照PRIMARY KEY 排序,相对于使用PRIMA...

2022-09-16
2

大数据ClickHouse进阶(五):副本与分片

ClickHouse数据存储时支持副本和分片,副本指的就是一份数据可以在不同的节点上存储,这些节点上存储的每份数据相同,数据副本是增加数据存储冗余来防止数据丢失。分片指的是ClickHouse一张表的数据可以横向切分为多份,每份...

2022-09-16
2