最新 最热

腾讯云大数据平台 TBDS全面升级,加速构建安全可控的大数据生态

8月22日,腾讯云大数据首届“智理无数,心中有数”伙伴交流会在深圳滨海大厦举办。本次会议主要围绕腾讯云大数据平台TBDS产品的全新升级,以及在渠道伙伴中的推广策略及应用实践展开。华云、国双、北明、东华、东方金信、...

2022-08-26
0

大数据ClickHouse(十):MergeTree系列表引擎之SummingMergeTree

该引擎继承了MergeTree引擎,当合并 SummingMergeTree 表的数据片段时,ClickHouse 会把所有具有相同主键的行合并为一行,该行包含了被合并的行中具有数值数据类型的列的汇总值,即如果存在重复的数据,会对对这些重复的数据进...

2022-08-26
0

大数据Apache Druid(八):Druid JDBC API和其他OLAP分析框架对比

在大数据处理场景中,我们可以编写接口来读取Druid中的数据进行聚合操作,以供可视化展示使用。下面使用jdbc的方式来读取Druid中的数据。

2022-08-24
0

数据治理(六):编译Atlas安装包

Atlas官网没有提供Atlas的安装包,需要下载Atlas的源码后编译安装,下载Atlas源码需要登录Atlas官网下载Atlas:https://atlas.apache.org/#/Downloads,选择2.1.0版本:

2022-08-22
0

大数据Apache Druid(五):Druid批量数据加载

Druid支持流式和批量两种方式的数据摄入,流式数据是指源源不断产生的数据,数据会一直产生不会停止。批量数据是指已经生产完成的数据。这两种数据都可以加载到Druid的dataSource中供OLAP分析使用。...

2022-08-21
0

(4)Flink CEP SQL贪婪词量演示

基于上一篇(3)Flink CEP SQL宽松近邻代码演示的延展,在上一篇中我们使用贪婪词量 +(至少匹配1行或多行),本篇将演示多种贪婪词量的效果:

2022-08-20
1

(1)Flink CEP复杂事件处理引擎介绍

复杂事件处理(CEP)既是把不同的数据看做不同的事件,并且通过分析事件之间的关系建立起一套事件关系序列库。利用过滤,聚合,关联性,依赖,层次等技术,最终实现由简单关系产生高级事件关系。...

2022-08-12
1

(8)FlinkSQL自定义UDF

Flink提供了自定义函数的基础能力,在需要满足特殊业务场景需求时,根据自身需要按需定制自己的UDF 下面将简单演示一个UDF的定义和UDF的使用过程:

2022-08-08
1

(7)FlinkSQL将kafka数据写入到mysql方式二

public static void main(String[] args) throws Exception { StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); ...

2022-08-08
1

(6)FlinkSQL将kafka数据写入到mysql方式一

图片这里不展开zookeeper、kafka安装配置(1)首先需要启动zookeeper和kafka图片(2)定义一个kafka生产者package com.producers;import com.alibaba.fastjson.JSONObject;import com.pojo.Event;import com......

2022-08-08
1