最新 最热

Spark整合HBase(自定义HBase DataSource)

Spark支持多种数据源,但是Spark对HBase 的读写都没有相对优雅的api,但spark和HBase整合的场景又比较多,故通过spark的DataSource API自己实现了一套比较方便操作HBase的API。...

2018-08-29
1

HBase缓存漫谈

上一次重度使用HBase已经是两年前了。HBase能够满足上面五个要求,所以用HBase作为画像体系的主要存储引擎便水到渠成。

2018-08-27
1

StreamingPro 简化流式计算配置

前些天可以让批处理的配置变得更优雅StreamingPro 支持多输入,多输出配置,现在流式计算也支持相同的配置方式了。

2018-08-27
1

Spark 如何写入HBase/Redis/MySQL/Kafka

一个partition 对应一个task,一个task 必定存在于一个Executor,一个Executor 对应一个JVM.

2018-08-27
1

大数据集群安全组件解析(含代码)

感谢阅读「美图数据技术团队」的第 5 篇文章,关注我们持续获取美图最新数据技术动态。

2018-08-22
1

Hbase的安装与部署

安装 HBase这里简单搭建了一个单机的 HBase 环境:安装 JDK 环境,如何安装jdk可以自己网上搜。下载 HBase,https://hbase.apache.org/downloads.html,这里我们选择下载2.0.1版本,文件名为 hbase-2.0.1.tar.gz,解压到任意目录...

2018-08-22
1

Hadoop学习笔记系列文章导航

这是一个信息爆炸的时代。经过数十年的积累,很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一,怎样从累积的数据里寻找价值,变废为宝炼数成金成为当务之急。但数据增长的速度往往比cpu和内存性能增长的速度...

2018-08-21
1

Hadoop学习笔记—15.HBase框架学习(基础实践篇)

伪分布模式安装即在一台计算机上部署HBase的各个角色,HMaster、HRegionServer以及ZooKeeper都在一台计算机上来模拟。

2018-08-20
1

HBase最佳实践-读性能优化策略

就职于网易杭州研究院后台技术中心数据库技术组,从事HBase开发、运维,对HBase相关技术有浓厚的兴趣。

2018-08-20
1

使用Spark通过BulkLoad快速导入数据到HBase

在项目中有需求需要将Hive表中的数据存储在HBase中。使用Spark访问Hive表,将读表数据导入到HBase中,写入HBase有两种方式:一种是通过HBase的API接口批量的将数据写入HBase,另一种是通过BulkLoad的方式生成HFile文件然后加...

2018-08-17
1