最新 最热

谷歌三大核心技术(二)Google MapReduce中文版

MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然后再创建一个Reduce函数用来合...

2022-04-14
1

全网最简单的React Hooks源码解析!

从React Hooks发布以来,整个社区都以积极的态度去拥抱它、学习它。期间也涌现了很多关于React Hooks 源码解析的文章。本文就以笔者自己的角度来写一篇属于自己的文章吧。希望可以深入浅出、图文并茂的帮助大家对React...

2022-04-11
0

Hadoop | 海量数据与Hadoop初识

Hadoop是一个使用JAVA开发的开源框架,是一个可以分析和处理海量数据的软件平台。它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据。它的目的是从单一的服务器到上千台机器的扩展,每一个台机都可以...

2022-04-11
0

【Python基础】reduce函数详解

reduce函数原本在python2中也是个内置函数,不过在python3中被移到functools模块中。

2022-04-09
1

二万字讲解HiveSQL技术原理、优化与面试

编译 SQL 的任务是在上节中介绍的 COMPILER(编译器组件)中完成的。Hive将SQL转化为MapReduce任务,整个编译过程分为六个阶段:

2022-04-07
0

万文Hive常用参数调优及优化(建议收藏)

hive.limit.optimize.enable=true --- 开启对数据源进行采样的功能 hive.limit.row.max.size --- 设置最小的采样容量 hive.limit.optimize.limit.file --- 设置最大的采样样本数

2022-04-07
0

Spark的两种核心Shuffle详解(面试常问,工作常用)

在 MapReduce 框架中, Shuffle 阶段是连接 Map 与 Reduce 之间的桥梁, Map 阶段通过 Shuffle 过程将数据输出到 Reduce 阶段中。由于 Shuffle 涉及磁盘的读写和网络 I/O,因此 Shuffle 性能的高低直接影响整个程序的性能...

2022-04-07
0

Hive SQL 参数与性能调优

Hive作为大数据平台举足轻重的框架,以其稳定性和简单易用性也成为当前构建企业级数据仓库时使用最多的框架之一。

2022-04-07
0

RavenDB文档建模--琐碎的注意事项--缓存查询属性

缓存查询属性是我们在实际开发中会遇到的,什么是缓存查询属性呢?举个例子来说,在电子商城的订单系统中每个账户都有自己的订单数据,有时用户需要查看自己截止到目前所订单的数量,那么这个账户的订单数量可以被视为 查询属...

2022-04-06
0