最新 最热

并发编程系列之线程join方法使用方法简介

本博客简介介绍一下java线程的join方法,join方法是实现线程同步,可以将原本并行执行的多线程方法变成串行执行的

2022-05-07
1

SQL命令 JOIN(二)

使用标准的“inner”联接时,当一个表的行链接到第二个表的行时,第一个表中找不到第二个表中对应行的行将从输出表中排除。

2022-05-06
0

RabbitMQ集群I5

加入集群 rabbitmqctl join_cluster rabbit@h101

2022-05-04
0

ArcGis小技巧 | 地理要素的重心转移

最近小编在忙一个比较大的项目。在这个项目中有一部分需要应用到地理重心转移来反映出某地理要素或现象在空间分布上的变化情况。鉴于有很多小伙伴都不是很了解“重心转移”这一方法,因此小编在今天抽出时间来向大家介...

2022-04-29
1

Hive优化器原理与源码解析—统计信息NDV唯一值数估算

NDV全称为Number Of Distinct Values,即非重复值的个数。

2022-04-25
1

Kafka 消费组 Rebalance机制

Rebalance 本质上是一种协议,规定了一个 Consumer Group 下的所有 consumer 如何达成一致,来分配订阅 Topic 的每个分区。

2022-04-25
0

clickhouse的sql语法2之select功能

选择语句是clickhouse的查询数据功能,我们需要使用每个参数的使用。下面我们一一介绍选择相关的。

2022-04-25
1

Java多线程二: Thread中几个比较重要的方法

sleep作为最常见的方法之一,其作用就是使调用sleep的所在线程进入睡眠状态。它会让调用该方法的所在线程主动放弃CPU资源,进入阻塞状态,如果指定了睡眠时间,到达了指定时间之后线程就会进入就绪状态,等待调度器的调用。sle...

2022-04-24
1

join实践: 万亿级数据量任务优化历程

重新分析两张表数据量,a 表数据量750w+, b 表数据量350w+, 在未做任何优化情况下数据是需要经过shuffle, 将相同的key分布到相同的节点上, 首先考虑使用mapjoin 解决,使其不用执行shuffle操作。...

2022-04-18
1

Flink DataStream中CoGroup实现原理与三种 join 实现

CoGroup 表示联合分组,将两个不同的DataStream联合起来,在相同的窗口内按照相同的key分组处理,先通过一个demo了解其使用方式:

2022-04-18
1