最新 最热

Notes: Hadoop-based open source projects

Here's my notes about introduction and some hints for Hadoop-based open source projects. Hope it's useful to you.

2022-07-15
1

Hadoop2.7.3+HBase1.2.5+ZooKeeper3.4.6搭建分布式集群环境详解

ZooKeeper可以独立搭建集群,HBase本身不能独立搭建集群需要和Hadoop和HDFS整合。

2022-07-13
1

linux经常使用命令

rm recommender-dm-1.0-SNAPSHOT-lib.jar

2022-07-12
1

HBase在京东人资数据预处理平台中的实践

人资绩效系统数据预处理平台,负责接收所有上游业务量数据。具有数据量大、非结构化数据、更新单个业务量数据,查询性能要求高等特性。通常技术上可以选择OSS、MySql数据库、ES等存储方案。其中OSS云存储方案,查询性能与...

2022-07-12
1

基于 Flink 实现的商品实时推荐系统(附源码)

根据用户特征,重新排序热度榜,之后根据两种推荐算法计算得到的产品相关度评分,为每个热度榜中的产品推荐几个关联的产品

2022-07-12
1

千万级数据查询:CK和ES选哪个?

在开发中遇到一个业务诉求,需要在千万量级的底池数据中筛选出不超过 10W 的数据,并根据配置的权重规则进行排序、打散(如同一个类目下的商品数据不能连续出现 3 次)。下面对该业务诉求的实现,设计思路和方案优化进行介绍。...

2022-07-11
1

【DB】HBase的基本概念

一 Hbase是个啥东东? 在说Hase是个啥家伙之前,首先我们来看看两个概念。面向行存储和面向列存储。面向行存储。我相信大伙儿应该都清楚,我们熟悉的RDBMS就是此种类型的。面向行存储的数据库主要适合于事务性要求严格场...

2022-07-10
1

读书笔记-HBase in Action-第二部分Advanced concepts-(2)Coprocessor

Coprocessor是HBase 0.92.0引入的特性。使用Coprocessor。能够将一些计算逻辑下推到HBase节点,HBase由一个单纯的存储系统升级为分布式数据处理平台。

2022-07-10
1

大数据Lambda架构「建议收藏」

批处理层主用由Hadoop来实现,负责数据的存储和产生随意的视图数据。

2022-07-08
1