最新 最热

Elasticsearch如何做到亿级数据查询毫秒级返回?

如果面试的时候碰到这样一个面试题:ES 在数据量很大的情况下(数十亿级别)如何提高查询效率?

2019-06-03
1

ElasticSearch在数十亿级别数据下,如何提高查询效率?

这个问题是肯定要问的,说白了,就是看你有没有实际干过 es,因为啥?其实 es 性能并没有你想象中那么好的。很多时候数据量大了,特别是有几亿条数据的时候,可能你会懵逼的发现,跑个搜索怎么一下 5~10s,坑爹了。第一次搜索的时候,...

2019-05-31
1

Elasticsearch如何做到亿级数据查询毫秒级返回?

如果面试的时候碰到这样一个面试题:ES 在数据量很大的情况下(数十亿级别)如何提高查询效率?

2019-05-31
1

Apache Kylin 查询流程源码剖析

其中 olap_model_6607769716595835175.json 内容如下:

2019-05-31
1

大数据技术之_27_电商平台数据分析项目_01_大数据的框架回顾 + 大数据的企业应用

Hadoopjob 提交简图 或 YARN 架构 或 YARN 工作机制 或 job 提交流程0、job 提交简图

2019-05-30
1

什么是rubick?如何从零构建大数据平台?

版权声明:本文为王小雷原创文章,未经博主允许不得转载 https://blog.csdn.net/dream_an/article/details/87099474

2019-05-29
1

基于 ZooKeeper 实现爬虫集群的监控

ZooKeeper 通常用于:命名服务、配置管理、集群管理、分布式协调/通知、分布式锁和分布式队列等等。

2019-05-28
1

HBase 常用命令

注意: 在 HBase Shell 中如果按退格键无法删除 , 则需要按 Ctrl + backspace 键

2019-05-28
1

如何将Hive与HBase整合联用

之前学习 HBase 就有疑惑,HBase 虽然可以存储数亿或数十亿行数据,但是对于数据分析来说,不太友好,只提供了简单的基于 Key 值的快速查询能力,没法进行大量的条件查询。...

2019-05-28
1

HBase原理(一):架构理解

Apache HBase 是基于 Hadoop 构建的一个分布式的、可伸缩的海量数据存储系统。常被用来存放一些海量的(通常在TB级别以上)、结构比较简单的数据,如历史订单记录,日志数据,监控 Metrics 数据等等,HBase 提供了简单的基于 K...

2019-05-28
1