最新 最热

23篇大数据系列(二)scala基础知识全集(史上最全,建议收藏)

蓝桥签约作者、大数据&Python领域优质创作者。管理多个大数据技术群,帮助大学生就业和初级程序员解决工作难题。

2022-09-19
1

spark笔记

本页面记录spark相关知识点# 1.spark介绍Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spa...

2022-09-19
1

数据倾斜?几招把你安排的板板正正的!

一般都发生在Sql中group by和join on上,而且和数据逻辑绑定比较深。

2022-09-19
1

Yelp 的 Spark 数据血缘建设实践!

在这篇博文中,我们介绍了 Spark-Lineage,这是一种内部产品,用于跟踪和可视化 Yelp 的数据是如何在我们的服务之间处理、存储和传输的。

2022-09-16
1

Spark面对OOM问题的解决方法及优化总结

map执行中内存溢出代表了所有map类型的操作,包括:flatMap,filter,mapPatitions等。

2022-09-16
1

进电商公司了。加分项:精通MySQL……

这两个月来,很多小伙伴留言问我618、双11各大电商后端的技术,最多的是关于系统压力暴增情况下如何进行MySQL数据库优化的。今天就结合我自己工作中的真实案例和大家分享一下吧。前几年我待过一家创业公司,做的是商城业务...

2022-09-14
1

从零到上亿用户,我把MySQL数据库优化玩明白了!

最近有粉丝秋招面试回来,说原来MySQL在互联网公司原来如此的重要!京东和阿里的面试中都被问到了。。。。。兄弟你才知道啊!防止在后续求职跳槽中还有对“MySQL”掉以轻心的人,这里给大家再简单强调一下:近年来在互联网行业...

2022-09-14
1

Spark Streaming详解(重点窗口计算)

如同SparkContext一样,StreamingContext也是Spark Streaming应用程序通往Spark集群的通道,它的定义如下:

2022-09-14
1

高并发 MySQL 优化指南

这两个月来,很多小伙伴留言问我618、双11各大电商后端的技术,最多的是关于系统压力暴增情况下如何进行MySQL数据库优化的。今天就结合我自己工作中的真实案例和大家分享一下吧。前几年我待过一家创业公司,做的是商城业务...

2022-09-13
1

大数据架构之– Lambda架构「建议收藏」

Lambda架构由Storm 的作者 [Nathan Marz] 提出, 根据维基百科的定义,Lambda 架构的设计是为了在处理大规模数据时,同时发挥流处理和批处理的优势。通过批处理提供全面、准确的数据,通过流处理提供低延迟的数据,从而达到平...

2022-09-12
1