最新 最热

用 Facebook Hydra 参数配置框架来简化程序配置

Facebook Hydra 允许开发人员通过编写和覆盖配置来简化 Python 应用程序(尤其是机器学习方面)的开发。开发人员可以借助Hydra,通过更改配置文件来更改产品的行为方式,而不是通过更改代码来适应新的用例。...

2021-06-10
1

[新星计划]Spark综合练习——电影评分数据分析

老师:给定需求统计评分次数>200的电影平均分Top10,并写入Mysql数据库中

2021-06-09
1

不愧是Alibaba技术官,Kafka的精髓全写这本“限量笔记”里,服了

分布式,是程序员必备技能之一,在面试过程中属于必备类的,在工作中更是会经常用到。而Kafka是一个分布式的基于发布订阅的消息队列,目前它的魅力是无穷的,对于Kafka的奥秘,还需要我们细细去探寻。...

2021-06-09
1

打造开放的云原生操作系统和系统软件架构

大家早上好,我今天给大家分享我们的基础软件建设。网易杭州研究院在整个网易集团的主要职责是为网易的非游戏业务构建统一的技术平台,来支撑网易音乐、网易新闻、严选,以及之前的考拉海购的业务需求。在 2019 年的时候,我...

2021-06-08
1

Ubuntu 18.04下安装Scala以及安装IntelliJ Scala插件(Plugin)

Scala的编程风格更简洁,当然也很可能降低可读性,不过Java语言还是有其优势。

2021-06-08
1

最佳实践丨XP2P日志系统“上云”及“全链路”压测实践

导语丨本文将介绍我们是如何通过日志链路做整体分析压测,以应对比赛到来的峰值。 一、背景 为了应对大型比赛的峰值需求,我们针对 XP2P 日志系统做了一次临时的日志统计系统的部署,通过集群扩展同写入的方式,支持了近千...

2021-06-07
1

如何调优Spark Steraming

云计算和大数据密不可分,这里有必要详细讨论下我的老本行——大数据领域。未来几年,我们将很荣幸地见证大数据技术的容器化。首先我们用几篇文章深入地了解一下大数据领域的相关技术。...

2021-05-31
1

简单回答:SparkSQL数据抽象和SparkSQL底层执行过程

就易用性而言,对比传统的MapReduce API,Spark的RDD API有了数量级的飞跃并不为过。然而,对于没有MapReduce和函数式编程经验的新手来说,RDD API仍然存在着一定的门槛。...

2021-05-28
1

假期充电 | 用经典图书评分数据集,练手推荐系统(附参考源码)

内容概要:五一假期过半,是不是光顾着玩啦?今天给大家推荐一个数据集,玩累了玩烦了,不如,学习一会儿?

2021-05-27
1

真是秀,ClickHouse批量导入还可以这样玩?

用过 HBase 的同学应该都知道,当批量导入数据的时候,可以利用 Spark 这样的计算引擎,直接将数据生成 HFile 一次性导入到 HBase,既有效地分离了 HBase 的计算压力,又实现了高效的数据导入。...

2021-05-27
1