最新 最热

大数据-Flink版本升级到1.17Maven中的相关依赖

https://nightlies.apache.org/flink/flink-docs-release-1.17/docs/dev/table/overview/

2023-09-01
1

谈谈大数据的核心技术

这些都不是大数据的核心技术:Hive、Spark、Mahout、Storm、HBase。只是大数据核心技术的衍生技术。我们知道大数据的发展经历了或者正在经历着:搜索引擎时代、数据仓库时代、数据挖掘时代、机器学习时代。...

2023-09-01
1

【第23题】傻傻的推出了,两个人打架,一个人赢了

腾讯云开发者社区是腾讯云官方开发者社区,致力于打造开发者的技术分享型社区。提供专栏,问答,沙龙等产品和服务,汇聚海量精品云计算使用和开发经验,致力于帮助开发者快速成长与发展,营造开放的云计算技术生态圈。...

2023-08-31
0

CloudEon入选开源中国最有价值开源项目(GVP)

亲爱的朋友们,CloudEon已成功入选开源中国2023年度最有价值开源项目(GVP),很荣幸能与大家分享这个喜讯。目前在码云(gitee)上托管了成千上万个开源项目,共有359个项目被评为GVP最有价值的开源项目。对于一个年轻的项目来说,Cl...

2023-08-24
0

Spark之基本流程(一)

最近在拜读许老师的《大数据处理框架Apache Spark设计与实现》,之前看豆瓣评分很高,阅读了一下果然通俗易懂,在这里记录一下相关的笔记,补充了一些个人理解,如有不对还请指正。参考链接:https://github.com/JerryLead/Spark...

2023-08-24
1

基于Docker搭建大数据集群(二)基础组件配置

root用户vim ~/.bash_profile非root用户只对当前用户生效vim /home/用户名/.bash_profile

2023-08-21
0

Python 在企业级应用中的两大硬伤

关系数据库是最常见的数据存储方案,SQL 自然也成为数据处理的第一选择。但随着企业级应用越来越复杂,使用 SQL 实现数据运算和处理也开始面临许多架构层面的严重问题。复杂的 SQL(存储过程)很难移植、计算处理都压进数据...

2023-08-19
0

基于Docker搭建大数据集群(八)Kafka部署

腾讯云开发者社区是腾讯云官方开发者社区,致力于打造开发者的技术分享型社区。提供专栏,问答,沙龙等产品和服务,汇聚海量精品云计算使用和开发经验,致力于帮助开发者快速成长与发展,营造开放的云计算技术生态圈。...

2023-08-17
1

基于Docker搭建大数据集群(五)Mlsql部署

docker cp mlsql-cluster-2.4_2.11-1.4.0.tar.gz cluster-master:/root/tardocker cp mlsql-console-1.4.0.tar.gz cluster-master:/root/tardocker cp mlsql-engine_2.4-1....

2023-08-17
0

基于Docker搭建大数据集群(四)Spark部署

docker cp spark-2.4.4-bin-hadoop2.7.tar.gz cluster-master:/root/tar

2023-08-17
1