最新 最热

Sqoop快速入门系列(1) | Sqoop的简单介绍及安装解析

Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到...

2020-10-28
0

Oozie快速入门系列(2) | 一文带你快速了解Oozie的使用(超详细!!!)

一. Oozie调度shell脚本 目标:使用Oozie调度Shell脚本   大体过程如下: 1. 创建工作目录[bigdata@hadoop002 oozie-4.0.0-cdh5.3

2020-10-28
0

React进阶(5)-分离容器组件,UI组件(无状态组件)

至今为止,关于React中的组件已经接触到了有很多,用类class声明的组件,函数式funtion关键字声明的组件,以及样式组件(styled-components),对于前面几节当中已经用Redux实现了一个todolist,但是代码依旧不够完美,我们继...

2020-10-28
1

Kylin快速入门系列(3) | Cube构建原理

我们知道,一个N维的Cube,是由1个N维子立方体、N个(N-1)维子立方体、N*(N-1)/2个(N-2)维子立方体、…、N个1维子立方体和1个0维子立方体构成,总共有2^N个子立方体组成,在逐层算法中,按维度数逐层减少来计算,每个层级的计算(除...

2020-10-28
1

React进阶(1)-理解Redux

在React中,数据流是单向的,并且是不可逆的,这其实,也很好理解,之所以这么设计,是因为组件复用的特点

2020-10-28
1

Hive快速入门系列(1) | Hive的基本概念(超详细,入门推荐!)

经过前面的学习之后,我们总算是来到了Hive阶段。本篇博客博主将为大家带来Hadoop组件之——Hive的介绍!

2020-10-28
0

Hive快速入门系列(10) | Hive的查询语法

注: 1、order by 会对输入做全局排序,因此只有一个reducer,会导致当输入规模较大时,需要较长的计算时间。 2、sort by不是全局排序,其在数据进入reducer前完成排序。因此,如果用sort by进行排序,并且设置mapred.reduce.tasks...

2020-10-28
0

Hive快速入门系列(12) | Hive的数据压缩介绍及使用

配置CentOS能连接外网。Linux虚拟机ping www.baidu.com 是畅通的 注意:采用root角色编译,减少文件夹权限出现问题

2020-10-28
0

Hive快速入门系列(14) | Hive性能调优 [一]Fetch抓取与本地模式

我们在刚开始学习hive的时候,都知道hive可以降低程序员的学习成本和开发成本,具体表现就在于可以将SQL语句转换成MapReduce程序运行。Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM employees...

2020-10-28
0

Hive快速入门系列(15) | Hive性能调优 [二] 表的优化

将key相对分散,并且数据量小的表放在join的左边,这样可以有效减少内存溢出错误发生的几率;再进一步,可以使用map join让小的维度表(1000条以下的记录条数)先进内存。在map端完成reduce。实际测试发现:新版的hive已经对小表JO...

2020-10-28
0