spark_字节宝

十年项目经验面试官亲传大数据面试__大数据面试独孤九剑

本项目涉及的业务数据包括订单、运输、仓储、搬运装卸等物流环节中涉及的数据、信息。由于多年的积累、庞大的用户群，每日的订单数上千万，传统的数据处理技术已无法满足企业需求。因此通过大数据分析可以提高运输配送效...

数据分析大数据 spark hive 运维

2021-12-30

Hadoop+Spark+Zookeeper+Hbase集群搭建

端口开放问题关闭防火墙systemctl stop firewalld，并在服务器开放以下端口：

spark https 网络安全 zookeeper hadoop

2021-12-30

Spark3.0核心调优参数小总结

基础配置 spark.executor.memory指定Executor memory,也就是Executor可用内存上限spark.memory.offHeap.enabled堆外内存启用开关spark.memory.offHeap.size指定堆外内存大小spark.memory.fraction堆......

spark bash bash指令 linux vr视频解决方案

2021-12-28

spark作业12

spark

2021-12-28

客快物流大数据项目(三)：项目解决方案

干线运输指的是运输的主干线, 在主干线上有最大的运力,一般快件的运行都是由支线去向主干线去汇集, 由主干线运输过去

spark Kafka 数据分析编程算法 windows

2021-12-27

Spark面试题汇总及答案（推荐收藏）

spark是借鉴了Mapreduce,并在其基础上发展起来的，继承了其分布式计算的优点并进行了改进，spark生态更为丰富，功能更为强大，性能更加适用范围广，mapreduce更简单，稳定性好。主要区别...

spark 数据库 SQL 大数据数据分析

2021-12-27

Spark优化(二)----资源调优、并行度调优

在开发完Spark作业之后，就该为作业配置合适的资源了。Spark的资源参数，基本都可以在spark-submit命令中作为参数设置。很多Spark初学者，通常不知道该设置哪些必要的参数，以及如何设置这些参数，最后就只能胡乱设置，甚至压根...

spark linux 编程算法

2021-12-23

【Spark重点难点08】Spark3.0中的AQE和DPP小总结

包括动态分区剪裁(Dynamic Partition Pruning)、自适应查询执行(Adaptive Query Execution)、加速器感知调度(Accelerator-aware Scheduling)、支持 Catalog 的数据源API（Data Source API with Catalog Supp......

spark 数据库 SQL

2021-12-22