最新 最热

大数据常用技术概要

MapReduce 适合批处理任务,也就是说每天对一个大量的静态数据集进行一次处理,同样,Spark 也非常的适合批处理任务,但是 Spark 有一个子模块就是 Spark Streaming 用于实时数据流处理...

2022-04-14
1

数栈在湖仓一体上的探索与实践

大数据技术的发展历程中,继数据仓库、数据湖之后,大数据平台的又一革新技术——湖仓一体近年来开始引起业内关注。市场发展催生的数据管理需求一直是数据技术革新的动力。比如数据仓库如何存储不同结构的数据?数据湖又如...

2022-04-14
1

大数据平台是否更应该容器化?

作者颜卫,腾讯高级后台开发工程师,专注于Kubernetes大规模集群管理和资源调度,有过万级集群的管理运维经验。目前负责腾讯云TKE大规模Kubernetes集群的大数据应用托管服务。 大数据的发展历史 大数据技术起源于Google在2...

2022-04-14
1

6月腾讯云容器产品技术月报 | 留言有惊喜

留言有奖 腾讯云容器产品技术产品月报 6月版,请阅。 继续给大伙薅羊毛的机会呀,点赞数最高的前 20条留言,送惊喜礼物哦~ 云原生 新势力 云原生新势力,新鲜出炉、热气腾腾的产品新特性,总有一款牵动你的心~ 腾讯云容器...

2022-04-14
1

[1101]flink常用参数说明

例:flink run -m yarn-cluster -yd -yjm 1024m -ytm 1024m -ynm -ys 1

2022-04-13
1

Flink整合ElasticSearch详细指南及踩坑记录

在使用Flink进行数据的处理的时候,一个必要步骤就是需要将计算的结果进行存储或导出,Flink中这个过程称为Sink,官方我们提供了常用的几种Sink Connector,例如:...

2022-04-13
1

Apache Griffin+Flink+Kafka实现流式数据质量监控实战

本文用的组件包括以下几个,是参考了官方案例,版本可以参考github以及里面的pom文件。本文假定以下环境均已安装好。

2022-04-13
1

Flink CDC 2.0原理详解和生产实践

CDC 的全称是 Change Data Capture ,在广义的概念上,只要能捕获数据变更的技术,我们都可以称为 CDC 。通常我们说的 CDC 技术主要面向 数据库的变更,是一种用于捕获数据库中数据变更的技术。...

2022-04-13
1

聊聊常用的一个APP,对我帮助很大!

经常看我文章的读者知道,我之前推荐过他们的很多课程,都是这个领域资深从业者推出的。

2022-04-11
1

啥是 “东数西算” ???

导读:日前,国家发改委、中央网信办、工信部和国家能源局联合印发通知,同意在京津冀、长三角、粤港澳大湾区、成渝、内蒙古、贵州、甘肃、宁夏等8地启动建设国家算力枢纽节点,并规划了10个国家数据中心集群。至此,全国一体...

2022-04-11
1