最新 最热

spark集群环境搭建

安装环境:CentOS-7.0.1708安装方式:源码安装软件:jdk-6u45-linux-x64.bin下载地址:http://www.Oracle.com/technetwork/Java/javase/downloads/java-archive-downloads-javase6-419409.html...

2022-08-08
1

❤ 想知道大厂面试都问什么吗,附最强面试技巧!!(大数据开发岗)❤

蓝桥签约作者、大数据&Python领域优质创作者。维护多个大数据技术群,帮助大学生就业和初级程序员解决工作难题。

2022-07-29
1

大数据常见问题:数据倾斜

一般都发生在Sql中group by和join on上,而且和数据逻辑绑定比较深。

2022-07-29
1

spark-submit 参数设置

在使用spark时,根据集群资源情况和任务数据量等,合理设置参数,包括但不限于以下:

2022-07-29
1

开发大数据基础教程(前端开发入门)

第一阶段:linux+搜索+hadoop体系Linux大纲这章是基础课程,帮大家进入大数据领域打好Linux基础,以便更好地学习Hadoop,hbase,NoSQL,Spark,Storm,docker,kvm,openstack等众多课程。因为企业中无一例外的是使用Linux来搭建或部...

2022-07-28
1

搭建Spark高可用集群

从右侧最后一条新闻看,Spark也用于AI人工智能 spark是一个实现快速通用的集群计算平台。它是由加州大学伯克利分校AMP实验室 开发的通用内存并行计算框架,用来构建大型的、低延迟的数据分析应用程序。它扩展了广泛使用...

2022-07-28
1

Spark Streaming 整合 Kafka

Spark 针对 Kafka 的不同版本,提供了两套整合方案:spark-streaming-kafka-0-8 和 spark-streaming-kafka-0-10,其主要区别如下:

2022-07-27
1

Spark Streaming 整合 Flume

Apache Flume 是一个分布式,高可用的数据收集系统,可以从不同的数据源收集数据,经过聚合后发送到分布式计算框架或者存储系统中。Spark Straming 提供了以下两种方式用于 Flume 的整合。...

2022-07-27
1

Spark Streaming 基本操作

这里先引入一个基本的案例来演示流的创建:获取指定端口上的数据并进行词频统计。项目依赖和代码实现如下:

2022-07-27
1

Spark Streaming与流处理

在流处理之前,数据通常存储在数据库,文件系统或其他形式的存储系统中。应用程序根据需要查询数据或计算数据。这就是传统的静态数据处理架构。Hadoop 采用 HDFS 进行数据存储,采用 MapReduce 进行数据查询或分析,这就是典...

2022-07-27
1