大数据与云计算技术周报(第141期)

2020-02-26 08:56:15 浏览数 (1)

导语

“大数据” 三个字其实是个marketing语言,从技术角度看,包含范围很广,计算、存储、网络都涉及,知识点广、学习难度高。 本期会给大家奉献上精彩的:Elasticsearch、hadoop 、Flink、MongoDB、推荐系统、SQl、DL。全是干货,希望大家喜欢!!!

1Elasticsearch

solr和es对比,值得看下

https://mp.weixin.qq.com/s/RSkmMo_9GENOLsCuE5YS1w

2Flink

本文讲解Flink 1.10.1此次版本升级中的主要新特性及优化。

https://mp.weixin.qq.com/s/9zuHvyyPXwEZJLU1IsjIDA

3ORACLE

基于ORACLE RAC 双活方案实施,难点在于远距离光纤条件下的节点之间的数据交互,尤其因为仲裁的原因,导致出现的脑裂现象较多,我们应该尽量规避这个风险。

https://mp.weixin.qq.com/s/DVZ0NR-VEKikqtu28pHJfw

4MongoDB

本文通过两个案例分别讲述了MongoDB并发写入的原子性问题及解决方案,并讲述了Spring Data Mongo中的乐观锁如何巧妙地解决多并发原子性方面的问题。

https://mp.weixin.qq.com/s/Bd8bFiGE75MTVJzHn13ysw

5Elasticsearch

今天给大家分享"腾讯万亿级 Elasticsearch 技术解密"。

https://mp.weixin.qq.com/s/JOkfa9eQfxkINWqxTHug-Q

6Flink

Flink 1.10.0 正式宣告发布!作为 Flink 社区迄今为止规模最大的一次版本升级,Flink 1.10 容纳了超过 200 位贡献者对超过 1200 个 issue 的开发实现,包含对 Flink 作业的整体性能及稳定性的显著优化、对原生 Kubernetes 的初步集成以及对 Python 支持(PyFlink)的重大优化

https://mp.weixin.qq.com/s/9zuHvyyPXwEZJLU1IsjIDA

7SQL

了解数据库编译器的特性,才能避规其短处,写出高性能的SQL语句。程序员在设计数据模型以及编写SQL语句时,要把算法的思想或意识带进来。

https://mp.weixin.qq.com/s/-NkJd4RN1sYMESN4l5tMcA

8Hadoop

后 Hadoop 世界中的大数据:考虑大数据的正确方式是,首先弄清楚你希望实现什么样的业务结果,然后从那里开始着手构建。

https://www.infoq.cn/article/2Ry9DqDwMxqS5b7JdZJt

9推荐系统

这篇文章介绍了机器学习推荐系统在LinkedIn招聘系统中的应用,大家可以重点关注不同业务场景中推荐系统所关注的业务指标。

https://mp.weixin.qq.com/s/Cv1QS3UF3BRyl8Ahq_JyEQ

10Pandas

我们都难以有充足的数据来完成任务,要保证完美的完成任务,有两件事情需要做好:(1)寻找更多的数据。(2)充分利用已有的数据进行数据增强,今天就来说说数据增强。

https://mp.weixin.qq.com/s/WqEfCnteMPmfWfC7Z_YocA

11开心一刻

* 亲爱的程序员同志们:

* * 你是第(500)个程序员尝试对这段代码优化

* * 浪费在这里的总时间 为(3609)小时

* 后来者请自觉维护注释中的两个数字变量,请做好累加工作,以示后人谨慎操作

0 人点赞