最新 最热

图解图库JanusGraph系列-janusgraph图数据库的本地源码编译教程(janusgraph source code compile)

源码分析 的第一步就是要先编译好源代码,才能进行debug跟踪流程查看,本文总结了janusgraph源码编译的全流程!

2022-05-11
1

简简单单用一下 Hbase

https://hbase.apache.org/book.html#_preface

2022-05-10
1

APM调用链产品对比

随着企业经营规模的扩大,以及对内快速诊断效率和对外SLA(服务品质协议,service-level agreement)的追求,对于业务系统的掌控度的要求越来越高,主要体现在:...

2022-05-09
1

一图胜千言:大数据入门必备的16张数据流转图(建议收藏)

以上便是本码农总结的15张大数据开发必背的数据流转图,有事没事拿出来看一看,潜移默化自然就记下来了~

2022-05-08
1

大数据系列思考题

个人理解: hdfs启动流程 hdfs是Hadoop Distribute File System 的简称,即分布式文件系统,用于存储海量数据. hdfs的启动分为三步:1.启动Namenode;2.启动Datanode;3.启动Secondary Namenode; 详细说说: Secondary Name...

2022-05-08
1

启动HBase2.1.0报错Caused by: java.lang.ClassNotFoundException: org.apache.htrace.SamplerBuilder

将htrace-core-3.1.0-incubating.jar复制到lib路径下,就可成功找到。

2022-05-08
1

Spark实现HIVE统计结果导入到HBase操作

由于HIVE更新的机制极其不适应SPARK环境,于是利用HBase来执行HIVE中某些统计结果的更新。首先要做的是实现Spark + Hive访问,得到RDD,再将这个RDD导入到HBase中操作。 然而网上关于这一块目前资料还真很少。但是其原理...

2022-05-07
1

Spark访问HBase的Eclipse代码实现

Hbase是一个列式数据库,从其本质上来看,可以当做是一个数据源,而Spark本身又可以进行Hbase的连接,访问数据并进行查询。

2022-05-07
1

ZooKeeper集群安装与Hbase全分布式安装

Apache ZooKeeper 是一个面向分布式应用程序的高性能协调服务器。要实现Hbase全分布式安装,需要安装ZooKeeper,当然后面kafka也需要安装这个东西。

2022-05-07
1

为已存在的Hadoop集群配置HDFS Federation

一、实验目的 1. 现有Hadoop集群只有一个NameNode,现在要增加一个NameNode。 2. 两个NameNode构成HDFS Federation。 3. 不重启现有集群,不影响数据访问。 二、实验环境 4台CentOS release 6.4虚拟机,IP地址为 19...

2022-05-07
1