最新 最热

开源项目丨一文详解一站式大数据平台运维管家 ChengYing 如何部署 Hadoop 集群

ChengYing 开源项目地址:github 丨 gitee 喜欢我们的项目给我们点个__ STAR!STAR!!STAR!!!(重要的事情说三遍)__

2022-09-21
1

实时湖仓一体规模化实践:腾讯广告日志平台

1. 背景1.1 整体架构腾讯广告系统中的日志数据流,按照时效性可划分为实时和离线,实时日志通过消息队列供下游消费使用,离线日志需要保存下来,供下游准实时(分钟级)计算任务,离线(小时级/天级/Adhoc)分析处理和问题排查等基于日...

2022-09-20
1

Spark pool_spark docker

h2{color:rgba(255, 255, 255, 1);background-color:rgba(124, 205, 124, 1);-moz-border-radius:3px;border-radius:3px;padding:3px;margin:10px 0;text-shadow:2px 2px 3...

2022-09-20
0

Zeppelin原理简介

Zeppelin是一个基于Web的notebook,提供交互数据分析和可视化。后台支持接入多种数据处理引擎,如spark,hive等。支持多种语言: Scala(Apache Spark)、Python(Apache Spark)、SparkSQL、 Hive、 Markdown、Shell等。本文主...

2022-09-20
1

细说分片上传与极速秒传(SpringBoot+Vue实现)

1)调大服务端的文件上传限制:在一定长度上可以缓解上传限制问题,但并不是最优解。一方面无限制地调大上传大小会加大服务端的压力;一方面这个限制值调成多少是个需要考量的问题。...

2022-09-20
0

流数据_数据回流是什么意思

https://www.liaoxuefeng.com/wiki/897692888725344/923030465280480

2022-09-20
0

Hadoop Spark太重,esProc SPL很轻

LogiKM(改名KnowStreaming) 是滴滴开源的Kafka运维管控平台, 有兴趣一起参与参与开发的同学,但是怕自己能力不够的同学,可以联系我,当你导师带你参与开源! 。...

2022-09-20
1

Hadoop Spark太重,esProc SPL很轻

LogiKM(改名KnowStreaming) 是滴滴开源的Kafka运维管控平台, 有兴趣一起参与参与开发的同学,但是怕自己能力不够的同学,可以联系我,当你导师带你参与开源! 。...

2022-09-20
1

袋鼠云思枢:数驹DTengine,助力企业构建高效的流批一体数据湖计算平台

7月28日,以“数智进化,现在即未来”为主题的袋鼠云2022产品发布会于线上正式开幕。发布会上,袋鼠云宣布将集团进行全新升级:从“数字化基础设施供应商”,升级为“全链路数字化技术与服务提供商”,并由袋鼠云产研负责人思枢...

2022-09-19
1