最新 最热

面试官嫌我Sql写的太low?要求我重写还加了三个需求?——二战Spark电影评分数据分析

这是我的上篇博文,当时仅是做了一个实现案例(demo级别 ),没想到居然让我押中了题,还让我稳稳的及格了(这次测试试卷难度极大,考60分都能在班上排进前10) 不过我在复盘的时候,发现自己的致命弱点:写sql的能力太菜了。。...

2022-05-08
1

Spark综合练习——电影评分数据分析

全部数据: 链接:https://pan.baidu.com/s/1qiO9aRb7yQeuHDtH1cWklw 提取码:nwxj

2022-05-08
0

大数据生态思维导图____2021最新最全Spark生态圈思维导图!

好了,本篇主要为大家带来的就是菜鸡博主为大家贡献的Spark的思维导图,剩余部分图片太大博客加载不了。

2022-05-08
0

Caused by: com.fasterxml.jackson.databind.JsonMappingException: Incompatible Jackson version: 2.9.6

问题在于spark目前使用的Jackson是2.6+,而storm-kafka-client和kafka使用的是2.9+,两者之间gradle默认使用最新的依赖2.9+,所以spark structure Streaming程序运行时报错,不兼容jackson高版本。...

2022-05-08
1

Flex开发常遇问题

Flex的一些零碎知识点,我是个flex初学者,很多知识点可能很幼稚,但是都是我学习和开发过程中遇到的问题。

2022-05-07
0

spark读取多个文件夹(嵌套)下的多个文件

在正常调用过程中,难免需要对多个文件夹下的多个文件进行读取,然而之前只是明确了spark具备读取多个文件的能力。

2022-05-07
0

spark-submit动态提交的办法(SparkLauncher实战)

Library for launching Spark applications.

2022-05-07
0

spark访问redis集群中某个数据库的问题

正常redis是没有数据库的概念的,但是当redis变成集群的时候,它是可以设置数据库的。(其实也就是开辟一块索引)

2022-05-07
0

spark dataframe新增列的处理

利用withColumn函数就能实现对dataframe中列的添加。但是由于withColumn这个函数中的第二个参数col必须为原有的某一列。所以默认先选择了个ID。

2022-05-07
1

spark批量读取大量小文件的办法

在实际工程中,经常会遇到要一起读取众多小文件的办法。本来正常情况下是进行文件夹的遍历。

2022-05-07
1