最新 最热

使用docker部署hadoop集群-手把手复现

hadoop 百度网盘:https://pan.baidu.com/s/1S9Sqwl3UN9cq2-dSdBGKRQ 提取码ca8s

2022-05-10
0

大数据平台01:Ambari2.7.5的编译和安装

终于,要开始写点大数据相关的文章了。当真的要开始写老本行的时候,还是考虑了挺久的。一是不知道从何处写起,二是如何能写点有意思的。

2022-05-09
0

我的程序员之路03:我和大数据

又是一年乍暖还寒,春天的风迎面而来,凉意中夹杂着些许温暖。哦,你知道,是春天来了。就像那年的实习期,在挥手告别的毕业季,定格在了那年的七月。...

2022-05-09
1

大数据平台安全认证 -- Kerberos

自从2018年大数据平台升级,Hadoop/Kafka从此被Kerberos立体环绕,虽然知道kinit/kdestory/klist命令,但是每次执行都感觉云里雾绕,尤其是对接租户的时候,多次陷入尴尬的境地。实习带我的老师曾提起培训一次kerberos,可是还没...

2022-05-09
1

数据读取与保存

Sequence文件 SequenceFile文件是Hadoop用来存储二进制形式的key-value对而设计的一种平面文件(Flat File)。在SparkContext中,可以调用sequenceFile[keyClass, valueClass](path)。...

2022-05-09
1

安装和体验hive-1.2

Hive是种基于Hadoop的数据仓库工具,将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。

2022-05-09
1

❤️hadoop常用命令总结及百万调优❤️

以下参数是在用户自己的MR应用程序中配置就可以生效(mapred-default.xml)

2022-05-08
1

Spark_Day01:Spark 框架概述和Spark 快速入门

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-4yHXs6Sp-1627098349792)(/img/image-20210419160056620.png)]

2022-05-08
1

大数据基础系列 5:Hadoop 实验——熟悉常用的 HDFS 目录操作和文件操作

本篇文章《大数据基础系列 5:Hadoop 实验——熟悉常用的 HDFS 目录操作和文件操作》是完全针对 HDFS 文件系统的,目的即理解 HDFS 在 Hadoop 体系结构中的角色,熟练使用 HDFS 操作常用的 Shell 命令,熟悉 HDFS 操作常用的...

2022-05-08
0