最新 最热

「EMR 开发指南」之通过 Java 连接 Hivesever2

Hive 中集成了 Thrift 服务。Thrift 是 Facebook 开发的一个软件框架,它用来进行可扩展且跨语言的服务的开发。Hive 的 HiveServer2 就是基于 Thrift 的,所以能让不同的语言如 Java、Python 来调用 Hive 的接口。对于 J...

2023-11-21
1

Hive 跨文件系统存储数据

Hive指定表的存储路径: hive可以在创建表的时候通过location指定表的存储路径,若不指定localtion则文件默认存储在hive-site.xml配置文件中hive.metastore.warehouse.dir配置项指向的路径。 此外,Hive的分区表还可以指定...

2023-11-20
2

HDFS 详解

HDFS采用master/slave架构。一个HDFS集群是由一个Namenode和一定数目的Datanodes组成。 Namenode是一个中心服务器,负责管理文件系统的名字空间(namespace)以及客户端对文件的访问。 集群中的Datanode一般是一个节点一...

2023-10-23
1

spark-submit --files

spark-submit --files通常用来加载外部资源文件,在driver和executor进程中进行访问

2023-10-17
1

大数据存储与处理技术探索:Hadoop HDFS与Amazon S3的无尽可能性【上进小菜猪大数据】

大数据时代带来了数据规模的爆炸性增长,对于高效存储和处理海量数据的需求也日益迫切。本文将探索两种重要的大数据存储与处理技术:Hadoop HDFS和Amazon S3。我们将深入了解它们的特点、架构以及如何使用它们来构建可扩...

2023-10-16
1

Hdfs FileSystem Client

Java抽象类org.apache.hadoop.fs.FileSystem定义了hadoop的一个文件系统接口。Hadoop中关于文件操作类基本上全部是在"org.apache.hadoop.fs"包中,这些API能够支持的操作包含:打开文件,读写文件,删除文件等。...

2023-06-30
1

solr系列--索引库存储在hdfs中

在hadoop-2.7.2/etc/hadoop下的hdfs-site.xml增加了以下内容

2023-06-29
1

HBase 在HDFS 上的目录树

自0.96版本之后,hbase 源码结构上做了很大的优化,目录结构也发生了变化,做了精简和优化,这里以0.98.8为例介绍,目录如下:

2023-06-29
1

【上进小菜猪】深入了解Hadoop:HDFS、MapReduce和Hive

在当今的大数据时代,数据的处理和分析已经成为企业发展的必要条件之一。Hadoop作为一种开源的大数据处理框架,已经成为后端大数据处理的重要工具之一。本文将介绍如何在后端使用Hadoop进行大数据处理,包括Hadoop的安装和...

2023-05-09
1

OushuDB 安装与升级之安装 HDFS

由于hadoop依赖于特定版本的snappy,请先卸载snappy确保安装的顺利进行:

2023-05-08
1