写在第57期
“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。
本期会给大家奉献上精彩的:HBase、Neo4j、FoundationDB、日志采集、知识图谱、数据管理、架构选型、IPv6、Elasticsearch、Alluxio、Redis、MongoDB。全是干货,希望大家喜欢!!!
#大数据和云计算技术社区#希望通过坚持定期分享能帮助同学在大数据学习道路上尽一份微博之力。相信长期坚持认真阅读周报的同学,在技术的道路上一定会日益精进!感谢编辑们的长期坚持!
以下是正文,限于众编辑水平有限,不保证大家都喜欢。
1
HBase
①主要介绍了HBase G1 GC 调优,GC时间缩短为原来的20%左右,内附详细介绍
https://blog.csdn.net/mtj66/article/details/78840059
②hbase是强一致性的海量数据库,无论是读写性能,或是数据容量,还是一致性方面,hbase都有非常优秀的表现,值得一看
https://mp.weixin.qq.com/s/GWaZ6DRPDHVqDhJEt8cIdQ
2
Neo4j
对nosql数据库来说,数据导入是非常关键的过程,本文以neo4j为例展开介绍。
https://mp.weixin.qq.com/s/ZYqDSx333nTCYBpHydfYMg
3
FoundationDB
苹果公司开源FoundationDB的简单分析,值得入门看看
https://mp.weixin.qq.com/s/XbJnZQGdkyvzYL5cFE8Hhg
4
日志采集
日志从最初面向人类演变到现在的面向机器发生了巨大的变化。日志的作用由最初问题的排查发展到今天可以通过日志生成可读性的报告以此来帮助人类做出决策。在这个转变的过程中,日志采集Agent在其中扮演着重要的角色。
https://mp.weixin.qq.com/s/TKgZzbS0gAm9wYgSHd_BwA
5
知识图谱
本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释
https://mp.weixin.qq.com/s/j94s-jQjJ11zXSDD_uEcAA
6
数据管理
大数据时代的到来,大家开始将数据当成资产,数据管理的意义也越来越大,但很多企业的数据管理工作,都难言成功,本文结合作者经验给出了对于数据管理的一些看法和思路
https://mp.weixin.qq.com/s/VGG4YGOwWha2h9sxh6tycQ
7
架构选型
通过对集中式和分布式架构在业务支撑、一致性/可用性、运维成本/故障恢复三个方面的分析 了解分布式架构和集中式系统的优缺点
https://mp.weixin.qq.com/s/wHR0iWb_39L94gBrf-fMZA
8
IPv6
IPV6作为下一代互联网技术基础,对物联网,车联网人工智能等新兴产业的发展有着重大影响。如今,中国云计算已完成了IPV4向IPV6的成功进军。
https://mp.weixin.qq.com/s/9GVeNrUJLaeJzYdia0HgWw
9
Elasticsearch
Elasticsearch 6.3 于前天正式发布,这个版本最大的亮点莫过于内置支持 SQL 模块!我在早些时间就说过 Elasticsearch 将会内置支持 SQL
https://mp.weixin.qq.com/s/FFitBpi73PZoDWCq2D3PfA
10
Alluxio
Alluxio是第一个将大数据统一起来的存储虚拟化技术,不需要拥有自己的永久副本并且充当一个“虚拟数据湖”。应用程序使用工业标准接口和一个全局命名空间访问Alluxio中的文件,就像这些文件在一个传统的数据湖中一样。Alluxio独特之处在于底层存储的集成是通过配置完成而不是通过ETL进行,并且数据驻留在它的源系统中,有效地消除了陈旧的数据。
https://mp.weixin.qq.com/s/9zcwyapeMFYEymQDDnZusQ
11
Redis
针对redis的高可用 作者以自己业务项目介绍
https://mp.weixin.qq.com/s/nR7kz_uK6iGkXpACcoOyoQ
12
MongoDB
Mongodb与SpringMVC整合,MongoDB的高级操作
https://www.cnblogs.com/zxf330301/articles/6558416.html
致谢:
周蓬勃、王在道、孙亚飞、冯艺帆、陈少军、邓开表、张少华、薛述强、刘彬、刘超、廖程鹏、董言、吕西金、朱洁、蓝随、黄文辉、郭飞、魏宏斌