最新 最热

Datagen-CDP平台的模拟数据生成器

Datagen 是一个项目,旨在提供一个用户友好、可定制的界面,以将数据生成到各种 Cloudera CDP平台服务中。(甚至在平台之外)。

2022-12-02
0

网络安全:大数据问题

信息技术一直是世界各国政府的核心,使他们能够提供重要的公民服务,例如医疗保健、交通、就业和国家安全。所有这些功能都依赖于技术并共享一种有价值的商品:数据。...

2022-12-02
0

CDP 多Namenode配置

此功能为 CDP Private Cloud Base 提供了使用多个备用名称节点的能力。

2022-12-02
0

Cloudera 流处理社区版(CSP-CE)入门

Cloudera 在为流处理提供综合解决方案方面有着良好的记录。Cloudera 流处理 (CSP) 由 Apache Flink 和 Apache Kafka 提供支持,提供完整的流管理和有状态处理解决方案。在 CSP 中,Kafka 作为存储流媒体底层,Flink 作为核...

2022-12-02
1

Join优化技术之Runtime Filter

Runtime Filter又称为Dynamic Filter,其目的在于通过在join的probe端提前过滤掉那些不会命中join的输入数据来大幅减少join中的数据传输和计算,从而减少整体的执行时间。简单来说就是利用小表的Join keys基于大表Join k...

2022-12-02
0

动图图解 | UDP就一定比TCP快吗?

作为一个程序员,假设我们需要在A电脑的进程发一段数据到B电脑的进程,我们一般会在代码里使用socket进行编程。

2022-12-02
1

助力工业物联网,工业大数据项目介绍及环境构建【一】

定义:Docker是一个开源的应用容器引擎,使用GO语言开发,基于Linux内核的cgroup,namespace,Union FS等技术,对应用程序进行封装隔离,并且独立于宿主机与其他进程,这种运行时封装的状态称为容器。...

2022-12-02
1

实时即未来,大数据项目车联网之创建Flink实时计算子工程【二】

文章目录写在前面车联网项目全新升级创建Flink实时计算子工程1 在原工程下创建实时分析子模块2 导入实时分析子模块pom依赖3 配置实时分析子模块资源文件创建Flink实时计算子工程1 在原工程下创建实时分析子模块总工...

2022-12-02
1

基于大数据架构实现景点游客数据分析平台,全国景点游客数据管理系统

随着最近几年旅游行业的兴起,越来越多的景区景点将传统模式的线下统计模式变更成为了线上分析统计模式,线上对景区游客数据的管理与监督的新型模式。很多的景点采用游客数据分析平台系统,在线上对不同景点内部的游客数据...

2022-12-02
1

维度模型数据仓库(十四) —— 杂项维度

(五)进阶技术         9. 杂项维度         本篇讨论杂项维度。简单地说,杂项维度就是一种包含的数据具有很少可能值的维度。例如销售订单,它可能有很多离散数据(yes-no这种类型的值),如...

2022-12-02
0