最新 最热

Hadoop使用学习笔记(2)

Input是将输入(比如数据库,网络,文件等)转化为Hadoop可以处理的标准输入。这里我们拿文件输入举例,假设我们有如下两个文件作为输入流:

2021-04-12
1

Hadoop使用学习笔记(1)

本文是用的Hadoop版本是最新的2.7.2发行版。 本文分两个机器环境,分别是研发环境和测试环境:

2021-04-12
1

Linux命令集合

创建一个普通用户hadoop,属于hadoop组,设置密码,管理员权限,自动创建home目录

2021-04-12
0

[转载]十六款值得关注的NoSQL与NewSQL数据库

传统关系型数据库在诞生之时并未考虑到如今如火如荼的移动、社交以及大数据负载类型,同时也并不适合处理极端规模处理任务。不过大家不必担心,十六家专业企业已经为我们带来他们各自的次世代NoSQL与NewSQL选项。...

2021-04-12
1

Zookeeper - 背景篇

Zookeeper以它的稳定性,高并发并且简单易用,目前在很多分布式系统中作为协调服务的中间件。Zookeeper官方文档很全面,目前,最新稳定版本为3.4.8:

2021-04-12
1

2021_03_25

A 问题1.spark⽀持故障恢复的⽅式? 2.详细说一下hadoop和spark的相同点和不同点? 3.spark如何保证宕机迅速恢复?A1 spark⽀持故障恢复的⽅式?主要包括两种⽅式...

2021-04-12
1

Hadoop使用学习笔记(5)

将之前的项目中的Resource中的除了log4j配置其他的文件全部删除。同时,添加本地库(就是之前从集群中拷贝下来的Hadoop文件夹),添加其目录下的share/hadoop中的所有文件作为一个library,如下所示:...

2021-04-12
0

Hadoop使用学习笔记(3)

我们先用老版本的API编写,下一篇会用新的API,并解释区别: 环境配置: 提交Job,开发IDE所在机器环境:Windows 7,4C8G,IntelliJ IDEA 15. Hadoop集群环境:第一篇中已经提到,Linux环境的集群。...

2021-04-12
0

大数据面试题百日更新_Hadoop专题(Day05)

大数据面试题百日更新_Hadoop专题(Day05)文章目录6. Secondary NameNode 不能恢复 NameNode 的全部数据,那如何 保证 NameNode 数据存储安全6

2021-04-09
1

大数据面试题百日更新_Hadoop专题(Day01)

1.客户端发起文件上传请求,通过RPC与NN(NameNode)建立通讯,NN根据检查文件,父目录是否已存在做出反馈 2.客户端请求第一个block该传输到哪些DN(DataNode)上; 3.NN根据配置文件中机架感知原理及备份数量进行文件分配,...

2021-04-09
1