mapreduce_字节宝

首页 / 技术

分布式计算框架MapReduce

MapReduce源自Google的MapReduce论文，论文发表于2004年12月。Hadoop MapReduce可以说是Google MapReduce的一个开源实现。MapReduce优点在于可以将海量的数据进行离线处理，并且MapReduce也易于开发，因为MapReduce框架帮...

mapreduce hadoop jar Java yarn

2020-09-23

4

使用Hadoop统计日志数据

首先我们需要根据日志信息抽取出浏览器信息，针对不同的浏览器进行统计操作。虽然可以自己实现这个功能，但是懒得再造轮子了，所以我在GitHub找到了一个小工具可以完成这个功能，GitHub地址如下：...

数据处理网站大数据打包 mapreduce

2020-09-23

4

初识Spark

Spark是Apache的一个顶级项目，Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架，Spark拥有Hadoo...

打包 spark scala mapreduce

2020-09-23

5

hadoop数据类型及自定义

自定义Hadoop数据类型后，需要明确告诉Hadoop来使用它们。这是 JobConf 所能担当的了。

mapreduce hadoop

2020-09-23

4

【React】717- 从零实现 React-Redux

在 React 诞生之初，Facebook 宣传这是一个用于前端开发的界面库，仅仅是一个 View 层。前面我们也介绍过 React 的组件通信，在大型应用中，处理好 React 组件通信和状态管理就显得非常重要。为了解决这一问题，Facebook 最先...

redux react mapreduce

2020-09-22

3

React Hooks-useTypescript!

在React v16.8新增了Hook，它提供了在函数组件中访问状态和React生命周期等能力，这些函数可以在程序的各个组件之间复用，达到共享逻辑的目的。

react 编程算法 mapreduce

2020-09-22

2

hive的order by操作

Hive中常见的高级查询包括：group by、Order by、join、distribute by、sort by、cluster by、Union all。今天我们来看看order by操作，Order by表示按照某些字段排序，语法如下：...

2020-09-22

4

hive的group by与distinct的区别及性能测试比较

相信使用Hive的人平时会经常用到去重统计之类的吧，但是好像平时很少关注这个去重的性能问题，但是当一个表的数据量非常大的时候，会发现一个简单的count(distinct order_no)这种语句跑的特别慢，和直接运行count(order_no)...

hive SQL mapreduce

2020-09-22

4

React进阶篇（八）react redux

我们只需要关注 getState() 和 dispatch(action) 即可。

redux react mapreduce

2020-09-22

6

函数（二）

定义函数时，参数可以有两种；一种是在参数表中写明参数名key的参数，固定了顺序和数量，如：

Serverless mapreduce

2020-09-22

2

112 113 114 115 116