最新 最热

spark环境搭建(idea版本)

【鼠标右键】点击【Run】执行即可,第一次执行需要的时间比较长,请耐心等待,可能【1分钟】后才能出来结果哦。

2022-11-29
1

SeaTunnel 连接器V1到V2的架构演进与探究

整个SeaTunnel设计的核心是利用设计模式中的控制翻转或者叫依赖注入,主要概括为以下两点:

2022-11-29
1

工作常用之Spark调优【二】资源调优

先设定单个 Executor 核数,根据 Yarn 配置得出每个节点最多的 Executor 数量,每个节

2022-11-28
1

工作常用之Spark调优【一】

Spark 3.0 大版本发布, Spark SQL 的优化占比将近 50% 。 Spark SQL 取代 Spark Core ,成

2022-11-28
1

Pyspark学习笔记(四)弹性分布式数据集 RDD 综述(上)

RDD(弹性分布式数据集) 是 PySpark 的基本构建块,是spark编程中最基本的数据对象;     它是spark应用中的数据集,包括最初加载的数据集,中间计算的数据集,最终结果的数据集,都是RDD。     从本质上来讲,RDD是对象分布...

2022-11-28
1

Pyspark学习笔记(二)--- spark部署及spark-submit命令简介

Pyspark学习笔记(二)--- spark部署及spark-submit命令简介

2022-11-28
1

马斯克称Twitter可能破产;Meta暴裁1.1 万人,小扎承认犯了错;GitHub年度报告:印度开发者增速超中国 | Q资讯

马斯克称 Twitter 有可能破产;扎克伯格宣布 Meta 裁员,裁员人数超过 Twitter;小冰公司融资 10 亿元人民币,投后估值 20 亿美元;周鸿祎“开炮”:特斯拉不安全;张朝阳称自己是中国互联网化石,但自我感觉年轻;英伟达用 SPARK 换掉...

2022-11-28
1

和Rust一样好,编程更安全?三年实践、员工态度反转,英伟达用 SPARK 换掉 C

近日,知名编程语言 Ada 与 SPARK 所属公司 AdaCore 表示,英伟达的产品运行着许多经过正式验证的 SPARK 代码。对于安全较为敏感的应用程序或组件,英伟达安全团队正在用 SPARK 语言取代 C 语言。...

2022-11-28
1

Python如何进行大数据分析?

大家应该都用Python进行过数据分析吧,Pandas简直就是数据处理的第一利器。但是不知道大家有没有试过百万级以上的数据,这时候再用Pandas处理就是相当的慢了。...

2022-11-28
1

Hive 到底有什么用?

MapReduce简化大数据编程难度,但对经常需大数据计算的人,如从事研究BI的数据分析师,他们通常使用SQL进行大数据分析和统计,MapReduce编程还是有门槛。且若每次统计和分析都开发相应MapReduce程序,成本确实太高。...

2022-11-28
1