最新 最热

ZooKeeper在HBase中的应用

HBase主要用ZooKeeper来实现HMaster选举与主备切换、系统容错、RootRegion管理、Region状态管理和分布式SplitWAL任务管理等。HMaster选举与主备切换HMaster选举与主备切换的原理和HDFS中NameNode及YARN中ResourceMan...

2018-06-04
1

快手-数据岗面经

18届-数据岗,快手一二三面+hr面[5月9日 11:00 一面-视频面 40分钟]1.自我介绍2.介绍做的项目,以及遇到的问题3.zookeeper监听原理4.hbase的应用场景5.redis的数据结构,zset的底层原理,跳跃表说一下6.如何解决hash冲突7....

2018-05-30
1

EMR之HBASE集群参数调优与压测

HBase 是Hadoop生态里重要一员。对HBase的调优,对节约成本,提升用户体验有重要意义。

2018-05-28
1

hadoop2.6和hbase1.0单机版安装配置

环境系统:Ubuntu 14.04 hadoop版本:2.6.0 hbase版本:1.0 jdk版本:1.8 下载地址:Apache上慢慢找吧~~----jdk的环境配置这里就不列出来了,首先讲一下hadoop配置吧。hadoop安装1.安装位置:/opt 2.创建hadoop用户组 ......

2018-05-23
1

Hadoop2.6+Zookper3.4+Hbase1.0部署安装

修改hbase-env.sh,添加java环境变量和生命使用外部zookeeper

2018-05-23
1

专访携程李亚锋:大数据技术融合下的Spark更具魅力

“大数据”作为当下最火热的IT行业词汇,在主流的数据处理工具当中Hadoop和Spark都被大家所熟悉。不过,目前基于内存计算的Spark适合各种迭代算法和交互式数据分析,能够提升大数据处理的实时性和...

2018-05-23
1

关于Hbase多版本存储的一个注意点

我们知道hbase是一个多版本的管理系统,在0.96的版本之前默认每个列是3个version,在hbase 0.96之后每个列是1个version,所谓的version其实就是同一条数据插入不同的时间戳来实现的,在hbase底层的存储是基于时间戳排序的,所...

2018-05-15
1

Elasticsearch如何保证数据不丢失?

上篇文章提到过,在elasticsearch和磁盘之间还有一层cache也就是filesystem cache,大部分新增或者修改,删除的数据都在这层cache中,如果没有flush操作,那么就不能100%保证系统的数据不会丢失,比如突然断电或者机器宕机了,但实...

2018-05-15
1

如何使用scala+spark读写hbase?

最近工作有点忙,所以文章更新频率低了点,希望大家可以谅解,好了,言归正传,下面进入今天的主题:如何使用scala+spark读写Hbase软件版本如下:scala2.11.8spark2.1.0hbase1.2.0公司有一些实时数据处理的项目,存储用的是hbase,提供...

2018-05-14
1

Spark如何读取Hbase特定查询的数据

最近工作需要使用到Spark操作Hbase,上篇文章已经写了如何使用Spark读写Hbase全量表的数据做处理,但这次有所不同,这次的需求是Scan特定的Hbase的数据然后转换成RDD做后续处理,简单的使用Google查询了一下,发现实现方式还是...

2018-05-14
1