最新 最热

Spark通识

在说Spark之前,笔者在这里向对Spark感兴趣的小伙伴们建议,想要了解、学习、使用好Spark,Spark的官网是一个很好的工具,几乎能满足你大部分需求。同时,建议学习一下scala语言,主要基于两点:1. Spark是scala语言编写的,要想学好...

2020-08-10
0

关于编程语言的一篇闲笔

在电脑面前发了一会呆,发现不知道写些啥了,思来想去,那么便写写在平时在数据处理过程常用的三门编程语言吧。这三门编程语言分别是 Python、Scala 和 Java。...

2020-08-10
0

Spark Kafka 基于Direct自己管理offset

在Spark Streaming中,目前官方推荐的方式是createDirectStream方式,但是这种方式就需要我们自己去管理offset。目前的资料大部分是通过scala来实现的,并且实现套路都是一样的,我自己根据scala的实现改成了Java的方式,后面...

2020-08-06
0

IDEA 本地运行 Spark Demo 报错

运行spark demo时出现java.lang.NoSuchMethodError: scala.Predef$.refArrayOps([Ljava/lang/Object;)。 这个问题可以说是新手必须会遇到的问题了,主要原因是环境中的 Scala 版本和 Spark 的 Scala 版本不一致所导致...

2020-08-06
0

说说 JetBrains

应该很多朋友都用过 JetBrains,今天突然有兴趣就查了一下相关的资料,分享给大家。因为字母太多,所以下文用 JB 来代替…

2020-08-06
0

sbt 项目导入问题

有用过 sbt 开发项目的同学应该都有这样的体会,换个环境,sbt 经常会出现编译项目出错的情况,导入 IDEA 又各种报错,尤其是在 github 上找到一个 sbt 编译的项目,想 clone 下来导入 IDEA 中阅读源码,跑跑测试用例,debug 进去...

2020-08-05
0

Delta Lake 学习笔记(二)

笔者认为,在研究一个开源项目的之前,看看起依赖管理的文件,比如说 Maven 的 pom.xml 文件,或者是 Sbt 的 build.sbt 文件。

2020-08-05
0

Delta Lake 学习笔记(一)

今天 Spark + AI Summit 2019 宣布开源了 Delta Lake 这个项目,关于这个项目的背景我就不赘述了,砖厂官网有很多介绍,包括项目的 Github 地址,大家可以上去看看,我也打算测一下,并且研究一下源代码,所以今天开始写一些探索这...

2020-08-05
0

scala 类型 的最详细解释

1.5 后引入了泛型,jvm 选择运行时擦除类型, 类型不可以只通过类信息进行判断. 比如: List<String>,List<Integer> 的class 都是 Class<List>,然而他们的类型是不相同的,泛型是需要通过反射来进行获得, 同时java通过增...

2020-08-05
0

scala 语法深析

scala是一种基于JVM的编程语言,spark框架是使用scala语言编写的,要阅读源码就必须掌握scala,虽然spark可以采用java和python进行开发,但是最快速的支持方式任然是scala方式的API....

2020-08-04
0