导语
“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。 本期会给大家奉献上精彩的:HBase、AI、MongoDB、实时计算、Spark、redis、Kylin、Brooklin、HBase。全是干货,希望大家喜欢!!!
1ClickHouse
ClickHouse 优秀的读写处理性能,丰富强大的函数支持,以及灵活的 SQL 查询,支撑了微博广告监控系统的百亿流量请求和复杂业务需求。
https://mp.weixin.qq.com/s/lx5BaREb0uVXwzTWJdWrcg
2实时计算
“数据智能” (Data Intelligence) 有一个必须且基础的环节,就是数据仓库的建设,同时,数据仓库也是公司数据发展到一定规模后必然会提供的一种基础服务。从智能商业的角度来讲,数据的结果代表了用户的反馈,获取结果的及时性就显得尤为重要,快速的获取数据反馈能够帮助公司更快的做出决策,更好的进行产品迭代,实时数仓在这一过程中起到了不可替代的作用。
本文主要讲述知乎的实时数仓实践以及架构的演进.
https://mp.weixin.qq.com/s/e8lsGyl8oVtfg6HhXyIe4A
3HBase
本文讲解了京东7000 节点HBase集群平台化的演进之路。
https://mp.weixin.qq.com/s/5WaeCXk0BILC7iJ3Q44bmw
本文主要讲解了通过hash或md5对HBase RK进行散列化处理时如何预建分区的方法,并提供了创建split计算器,用于从抽样数据中生成一个比较合适的splitKeys用于创建预分区,可以直接拿来用的。
https://blog.csdn.net/liyonghui123/article/details/84701105?from=timeline
4Spark
本文将探讨我们在计算平台上的选型,为什么选择基于Spark构建计算平台,我们是如何使用Spark的,以及基于此又做了什么更多的工作。
巨人的肩膀,站的更远 https://mp.weixin.qq.com/s/N4iLpQEsXuD0uVtmB6XQlw
5MongoDB
本文讲述了MongoDB的compact命令的作用,对读写操作的影响,以及WiredTiger存储引擎如何执行compact,预估compact回收空间;
http://www.mongoing.com/archives/26907
6Kylin
海量数据下的用户访问行为分析一直是一大难题,满帮集团作为全国最大的车货匹配信息平台,每天会产生近十亿的流量数据,半年即达千亿级数据规模,如何做到快速地响应业务方的多维查询、自定义漏斗分析、留存分析、用户画像等流量分析需求。
https://mp.weixin.qq.com/s/77fveA9q_AQWBYYxpdpgYg
7Brooklin
Brooklin 是一种近实时的大规模数据流分布式服务,LinkedIn 自 2016 年以来一直在使用这项服务,支撑每天数千个数据流和超过 2 万亿条消息。近日,LinkedIn 正式宣布开源 Brooklin!
https://mp.weixin.qq.com/s/JC7BFW7rA1azHOs-zqjrpQ
8AI
本文将介绍腾讯 AI Lab & Robotics X 主任张正友博士在 CCF-GAIR 2019 大会上所做的报告,讲述计算机视觉研究的历史和未来。
https://mp.weixin.qq.com/s/ZKmB27qdjyIsvdT9x7UDOg
9Redis
十二张图详解Redis的数据结构和对象系统
https://mp.weixin.qq.com/s/HgwmTlmV_d2dOmAl-fYzkQ
10开心一刻
我很奇怪客栈这个词,难道后入住的必须先退房吗?
致谢:
周蓬勃、王在道、孙亚飞、冯艺帆、陈少军、邓开表、张少华、薛述强、刘彬、刘超、廖程鹏、董言、吕西金、朱洁、蓝随、黄文辉、郭飞
猜你喜欢
#大数据和云计算机技术社区#博客精选(2017)
NoSQL 还是 SQL ?这一篇讲清楚
阿里的OceanBase解密
#大数据和云计算技术#: "四有"社区介绍
大数据和云计算技术周报(第56期)
新数仓系列:Hbase周边生态梳理(1)
《大数据架构详解》第2次修订说明
简单梳理跨数据中心数据库
云观察系列:漫谈运营商公有云发展史
云观察系列:百度云的一波三折
云观察系列:阿里云战略观察
超融合方案分析系列(7)思科超融合方案分析