最新 最热

大数据毕业设计 – 选题推荐(一)

近期开题的同学越来越多,很多同学不知道怎么选题,不知道老师分配的题目应该怎么做,指导老师分享的信息不多,无从下手。

2022-09-01
1

hadoop生态圈各个组件简介

Hadoop 是一个能够对大量数据进行分布式处理的软件框架。具有可靠、高效、可伸缩的特点。

2022-08-31
0

Hadoop生态系统-一般详细

首先我们先了解一下Hadoop的起源。然后介绍一些关于Hadoop生态系统中的具体工具的使用方法。如:HDFS、MapReduce、Yarn、Zookeeper、Hive、HBase、Oozie、Mahout、Pig、Flume、Sqoop。...

2022-08-31
1

玩转Java8 Stream流

点击上方“芋道源码”,选择“设为星标”管她前浪,还是后浪?能浪的浪,才是好浪!每天 10:33 更新文章,每天掉亿点点头发...源码精品专栏原创 | Java 2021 超神之路,很肝~中文详细注释的开源项目RPC 框架 Dubbo 源码解析网络...

2022-08-31
0

Hadoop生态系统功能组件,主要包括哪些?[通俗易懂]

经过多年的发展,Hadoop生态系统不断完善和成熟,目前已经包括了多个子项目,除了核心的HDFS和MapReduce以外,Hadoop生态系统还包括要ZoopKer、HBase、Hive、Pig、Mahout、Sqoop、Flume、Ambari等功能组件。...

2022-08-31
1

Hadoop的生态系统介绍

Hadoop分布式文件系统是Hadoop项目的两大核心之一,是针对谷歌文件系统(GoogleFileSystem,GFS)的开源实现。是Hadoop体系中数据存储管理的基础。它是一个高度容错的系统,能检测和应对硬件故障,用于在低成本的通用硬件上运...

2022-08-31
0

【Hive】SQL语句大全

继承 org.apache.hadoop.hive.ql.udf.generic.GenericUDTF;

2022-08-30
0

从应用到源码-深入浅出Redux

文章中的每一行代码都是笔者深思熟虑敲下的,欢迎对 Redux 感兴趣的同学共同讨论。

2022-08-30
1

0889-7.1.7-Hive on Tez解析以及日志分析

1.Tez简介Tez 是支持 DAG 作业的开源计算框架,它可以将多个有依赖的作业转换为一个作业从而大幅提升 DAG 作业的性能。从本质上讲,Tez 组成非常简单,只有两个组成部分:数据处理管道引擎,其中一个引擎可以输入,处理和输出实...

2022-08-29
1

使用Docker快速搭建Kerberos环境

Kerberos认证在大数据场景下用的比较多,特别是在Hadoop生态下,认证基本用的都是Kerberos认证。一般来讲Kerberos认证相对于其他方式的认证安全很多,同样的认证的时候性能应该差一点。...

2022-08-26
1