最新 最热

20张图搞懂从0到1搭建企业级数据治理体系

好的数据治理体系可以盘活整条数据链路,最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯。

2022-11-11
1

JuiceFS 专为云上大数据打造的存储方案

JuiceFS 是一款面向云原生设计的高性能共享文件系统,在 Apache 2.0 开源协议下发布。提供完备的 POSIX 兼容性,可将几乎所有对象存储接入本地作为海量本地磁盘使用,亦可同时在跨平台、跨地区的不同主机上挂载读写。...

2022-11-10
1

Flink 源码走读(一)

flink提交作业是通过flink run进行提交的,可以从提交脚本中看到启动类即程序的入口是:

2022-11-10
1

Flink kafka sink to RDBS 测试Demo

表的输出,是通过将数据写入 TableSink 来实现的。TableSink 是一个通用接口,可以 支持不同的文件格式、存储数据库和消息队列。

2022-11-10
1

Flink sql 窗口函数

窗口函数Flink SQL支持基于无限大窗口的聚合(无需在SQL Query中,显式定义任何窗口)以及对一个特定的窗口的聚合。例如,需要统计在过去的1分钟内有多少用户点击了某个的网页,可以通过定义一个窗口来收集最近1分钟内的数据,并...

2022-11-10
1

Hbase 整理

{row, column, version}元组就是一个HBase中的一个 cell。

2022-11-10
1

spark知识整理

Spark是基于内存计算大数据分析引擎,提高了在大数据环境下数据处理的实时性。Spark目前来说仅仅只涉及到数据的计算,并没有涉及到数据的存储。

2022-11-10
1

大数据,云计算,物联网三者的区别和关联方法_云计算和物联网的应用

大数据时代的到来,是全球知名咨询公司麦肯锡最早提出的,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。”...

2022-11-10
1

hive中操作hdfs命令

– 查看dfs帮助信息 [root@hadp-master sbin]# dfs Usage: dfs [generic options] [-appendToFile … ] [-cat [-ignoreCrc] …] [-checksum …] [-chgrp [-R] GROUP PATH…] [-...

2022-11-10
1

云计算、大数据和物联网三者之间有哪些区别和联系?_云计算物联网大数据的区别

云计算、大数据和物联网代表了IT领域最新的技术发展趋势,三者既有区别又有联系。云计算最初主要包括了两类含义:一类是以谷歌的GFS和MapReduce为代表的大规模分布式并行计算技术;另一类是以亚马逊的虚拟机和对象存储为代...

2022-11-10
1