最新 最热

大数据开发:Spark Structured Streaming特性

在Spark框架当中,早期的设计由Spark Streaming来负责实现流计算,但是随着现实需求的发展变化,Spark streaming的局限也显露了出来,于是Spark团队又设计了Spark Structured Streaming。今天的大数据开发学习分享,我们就主要...

2021-07-30
0

大数据开发:Spark运行原理

在大数据的诸多技术框架当中,Spark发展至今,已经得到了广泛的认可。Hadoop与Spark可以说是大部分企业级数据平台的主流选择,基于不同的应用场景,结合实际需求,来选择相应的技术架构。今天我们来聊聊Spark运行原理。...

2021-07-29
0

大数据开发:Spark核心概念RDD入门

Spark在大数据处理上的优势,很大一部分来自数据处理速度的提升,这使得Spark在面对大规模实时计算的数据任务时,能够更快地完成大批量数据的处理,提升大数据处理的效率。而Spark获得的这些优势,核心关键在于RDD,今天我们为大...

2021-07-28
0

Flink会取代Spark吗?谈谈大数据框架之间的竞争

在大数据计算领域,先后出现了Hadoop、Spark、Storm、Flink等多个计算框架,并且每每当一个新兴计算引擎出现,大家就忍不住拿来与早期的计算引擎进行对比。然后就会出现诸如Flink会取代Spark吗,Flink和Spark哪个好等等的问...

2021-07-27
0

大数据开发:Spark数据处理核心架构

作为大数据领域主流运用的大数据计算框架之一,Spark这几年的发展态势也越来越好了。一方面是由于Spark在不断地完善,更适用于现阶段的大数据处理;另一方面则是因为Spark确实在大数据处理上表现出了强大的优势。...

2021-07-26
0

NBI可视化集成clickhouse,实现百亿级数据分析能力

ClickHouse是一款MPP架构的列式存储数据库,并允许使用SQL查询实时生成分析报告,也是一个新的开源列式数据库。

2021-07-23
1

大数据开发:Hadoop数据分析应用场景

对于海量数据价值的挖掘,需要通过大数据分析来实现,而这些数据由于具有不同于传统数据的新特征,传统的数据分析技术和工具都不能高效的进行处理,因而才有了基于大数据技术平台进行大数据分析的需求。今天,我们以Hadoop框架...

2021-07-22
0

大数据开发:大数据Hadoop好学吗?

在大数据技术体系当中,Hadoop无疑是占据着非常重要的位置。从2005年Hadoop项目诞生开始,到如今发展到相对成熟稳定的阶段,Hadoop技术在大数据处理当中的重要性无疑是值得关注的,很多企业也在招聘Hadoop数据工程师。那么大...

2021-07-21
0

大数据开发:Hadoop数据可视化展示

在大数据时代,数据价值的挖掘非常重要,而挖掘出来的数据价值成果,需要展示出来,尤其是展示给相关业务人员,才能得到理解和下一步的运用,这也就是大家所说的数据可视化的问题。那么在Hadoop框架当中,Hadoop数据展示主要是怎么...

2021-07-20
1

大数据开发:Hadoop架构如何提高数据吞吐量?

Hadoop架构在目前的大数据处理上,具有极大的优势,其中主要的一个原因就是Hadoop解决了系统进行数据处理的数据吞吐量的问题。海量的大数据通过Hadoop架构集群能够进行高效稳定的数据处理,那么Hadoop吞吐量是如何通过系统...

2021-07-19
0