最新 最热

Phoenix的使用

bin/sqlline.py数据库安装服务器ip或主机名:zookeeper的服务端口号

2020-08-05
1

快速认识Hadoop生态系统

就目前来说Hadoop已经成为处理大数据的问题的必备的组件,许多的大厂都已经在使用Hadoop软件栈处理自己的问题,那为什么Hadoop技术栈这么流行?

2020-08-05
1

Spring集成Hadoop和Hbase

hadoop是大数据环境下必备的一套系统,使用hadoop集群可以充分的共享服务器资源,在离线处理上已经有了多年的应用。

2020-08-04
1

Hbase API 详解

standalone模式下hbase的主目录配置为本地的目录‘file://' 使用./start-hbase.sh启动hbase可以在jps看到一个HMaster,一个HReginServer,以及Zookeeper的线程。

2020-08-04
1

将数据文件(csv,Tsv)导入Hbase的三种方法

(1)使用HBase的API中的Put是最直接的方法,但是它并非都是最高效的方式(2)Bulk load是通过一个MapReduce Job来实现的,通过Job直接生成一个HBase的内部HFile格式文件来形成一个特殊的HBase数据表,然后直接将数据文件加载到运...

2020-08-04
1

Hbase的快速使用

HBase是基于HDFS之上的,也可以采用存储本地模式,HBase是分布式数据库,将数据分为多份,同时是面向列的数据库,是bigtable的实现。

2020-08-04
1

Phoenix index 二级索引

一、索引的创建 通过二级索引,索引的列或表达式形成一个备用行键,以允许沿着这个新轴进行点查找和范 围扫描。 (1)覆盖索引 覆盖索引,一旦找到索引的条目,不需要返回主表,会把我们关心的数据绑定到索引行,节 省读取的...

2020-08-04
1

Hbase原理与架构

我们都知道Hbase是一个构建在HDFS上的分布式列存储系统。Hbase主要用于海量数据的结构化存储。

2020-08-04
1

spark读取Hive

导入依赖导入关键的依赖包 compile("org.scala-lang:scala-library:$scalaVersion") compile("org.scala-lang:scala-reflect:$scalaVersion") compile("org.scala-lang:sc......

2020-08-04
1

基于docker快速搭建hbase集群

HBase是一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”。就像Bigtable利用了Google文件系统(File System)所提供的分布式数据存储一样,HBase...

2020-08-03
1