HBase_字节宝

有赞百亿级日志系统架构设计

墨墨导读：本文跟大家分享有赞在当前日志系统的建设、演进以及优化的经历，这里先抛砖引玉，欢迎大家一起交流讨论。

日志数据 Kafka ide hbase HTTP

2019-07-05

有赞百亿级日志系统架构设计

原文：http://www.enmotech.com/web/detail/1/735/1.html （复制链接，打开浏览器即可查看）

日志数据 Kafka ide hbase TDSQLMySQL版

2019-07-03

ambari的服务启动顺序如何设置

角色是组件的另一个名称（例如：NAMENODE，DATANODE，RESOURCEMANAGER，HBASE_MASTER等）。顾名思义，可以告诉Ambari关于应该为堆栈中定义的组件运行命令的顺序。例如：“应在启动NameNode之前启动ZooKeeper服务器”。或者“只有在...

JavaScript hbase 编程算法 TDSQLMySQL版 zookeeper

2019-07-03

es 在数据量很大的情况下（数十亿级别）如何提高查询效率？

转载自:https://zhuanlan.zhihu.com/p/60458049

文件存储缓存 hbase TDSQLMySQL版

2019-07-02

腾讯云 EMR 常见问题100问（持续更新）

Hadoop 目前是数据处理的标准工具，其核心组件包含了HDFS（分布式文件系统）、YARN(资源调度平台)、

hbase TDSQLMySQL版 emr hive 大数据

2019-07-02

布隆过滤器(bloom filter)的原理及在推荐去重中的应用

在业务中,我需要给每个用户保存1w条浏览记录,之后每一次的返回值都要和历史记录做一个去重,即保证用户不会重复看到同一篇文章.

hbase TDSQLMySQL版编程算法云数据库Redis

2019-07-01

Elasticsearch如何做到亿级数据查询毫秒级返回？

如果面试的时候碰到这样一个面试题：ES 在数据量很大的情况下(数十亿级别)如何提高查询效率?这个问题说白了，就是看你有没有实际用过 ES，因为啥?其实 ES 性能并没有你想象中那么好的。很多时候数...

文件存储缓存 hbase TDSQLMySQL版

2019-06-26

我是如何成为Apache Kudu committer & PMC的？

米从2012年开始正式涉足开源，不光积极参与开源社区，修复bug，提交代码，同时逐渐将自研的系统或框架进行开源，先后开源了企业级、高可用、可扩展的监控系统Open-Falcon、分布式 Key-Value存储系统Pegasus、移动端深度学习框...

开源 apache hbase TDSQLMySQL版 SQL

2019-06-25

HBase使用

HBase是一种Hadoop数据库，经常被描述为一种稀疏的，分布式的，持久化的，多维有序映射，它基于行键、列键和时间戳建立索引，是一个可以随机访问的存储和检索数据的平台。HBase不限制存储的数据的种类，允许动态的、灵活的数据模型...

hbase

2019-06-25

一文读懂分库分表的技术演进（最佳实践）

以支付宝用户为例，8亿；微信用户更是10亿。订单表更夸张，比如美团外卖，每天都是几千万的订单。淘宝的历史订单总量应该百亿，甚至千亿级别，这些海量数据远不是一张表能Hold住的。事实上MySQL单表可以存储10亿级数据，只是这时候...

hbase

2019-06-21

98 99 100 101 102

有赞百亿级日志系统架构设计

有赞百亿级日志系统架构设计

ambari的服务启动顺序如何设置

es 在数据量很大的情况下（数十亿级别）如何提高查询效率？

腾讯云 EMR 常见问题100问（持续更新）

布隆过滤器(bloom filter)的原理及在推荐去重中的应用

Elasticsearch如何做到亿级数据查询毫秒级返回？

我是如何成为Apache Kudu committer & PMC的？

HBase使用

一文读懂分库分表的技术演进（最佳实践）

热门文章

热门手册