最新 最热

大数据技术笔试题库

12、在MapTask的Combine阶段,当处理完所有数据时,MapTask会对所有的临时文件进行一次()。

2022-05-14
1

【知识】ETL大数据集成工具Sqoop、dataX、Kettle、Canal、StreamSets大比拼

对于数据仓库,大数据集成类应用,通常会采用ETL工具辅助完成。ETL,是英文 Extract-Transform-Load 的缩写,用来描述将数据从来源端经过抽取(extract)、交互转换(transform)、加载(load)至目的端的过程。当前的很多应用也存在大量...

2022-05-13
1

Elasticsearch 写入优化,从 3000 到 8000/s,让你的 ES 飞起来!

点击关注公众号,Java干货及时送达背景基于elasticsearch-5.6.0机器配置:3个云ecs节点,16G,4核,机械硬盘优化前,写入速度平均3000条/s,一遇到压测,写入速度骤降,甚至es直接频率gc、oom等;优化后,写入速度平均8000条/s,遇到压测,能...

2022-05-12
1

Hadoop Delegation Tokens详解【译文】

本文是cloudera公司的一篇技术博客,原文地址: Hadoop Delegation Tokens Explained

2022-05-12
1

Hive Format异常分析

本文已上述的错误为切入点,分析下异常原因以及Hive相关的关于Format的异常。主要内容如下:

2022-05-12
1

Kylin的入门实战

1.Kylin 是一款大数据OLAP引擎,由ebay-中国团队研发的,是第一个真正由中国人自己主导、从零开始、自主研发、并成为Apache顶级开源项目

2022-05-12
1

Java架构师技术学习清单(2019修订版)

链接:互联网技术脑图(Java) 说明:最新互联网技术脑图,用心制作,查缺补漏必备,持续维护中!欢迎提意见和补充~

2022-05-12
0

杨校老师课堂之分布式数据库HBase的部署和基本操作

(1) 安装JDK、Hadoop,这里采用的JDK1.8,Hadoop2.7.4,CentOS7.6

2022-05-11
1

用java程序操作hadoop,intellij IDEA和maven的使用

如果用hadoop直接操作,还要学一些专门的hadoop指令,其实也可以用java代码来操作hadoop 首先电脑上安装intellig IDEA,notepad++,之前开启的hadoop集群(三台linux虚拟机) 首先,在windows下设置hadoop环境:...

2022-05-11
0

MapReduce开发运行的精简原理

相信关于Hadoop中MapReduce的相关文章会很多,这里只简单介绍一下MapReduce的相关知识。

2022-05-11
1