最新 最热

【rainbowzhou 面试13/101】技术提问--说说你了解的大数据应用产品?

在【rainbowzhou 面试3/101】技术提问--大数据测试是什么,你如何测?中,我提到了大数据的测试还有一类,即对大数据应用产品的测试。大数据应用产品常见的有BI报表、用户画像系统、数据挖掘平台等,今天就聊聊关于用户画像的...

2023-03-16
1

【rainbowzhou 面试8/101】技术提问--如何进行大数据基准测试?

在【rainbowzhou 面试3/101】技术提问--大数据测试是什么,你如何测?中,我介绍了大数据系统测试之基准测试。本篇将从大数据基准测试是什么,为什么做大数据基准测试,大数据基准测试的步骤有哪些三个方面来谈谈笔者如何进行...

2023-03-16
1

大数据分析工具Power BI(一):Power BI介绍

Microsoft Power BI 是一款强大的自助商业智能分析工具,可以对来自不同系统的数据进行提取、清理、整合、汇总、分析、可视化展示。简单来说,Power BI就是一个数据分析工具,它能实现数据分析的所有流程,包括对数据的获取...

2023-03-14
0

混合云数据中心:优缺点及应用场景

混合云数据中心已针对此问题进行了定制。主要价值在于支持快速发展的数字业务转型、推动成本节约和维护数据机密性。混合云数据中心理想地结合了公共云和私有云的最佳特性。...

2023-03-13
1

大数据技术

这些前置技能就是仅供参考,等到学习大数据时,搭建Hadoop环境等的,能够很好的帮助理解。

2023-03-09
1

Hadoop 配置文件详解

mapred-site.xml:yarn 的 web 地址 和 history 的 web 地址以及指定我们的 mapreduce 运行在 yarn 集群上

2023-03-09
1

Flink SQL 优化

Flink SQL可以指定空闲状态(即未更新的状态)被保留的最小时间 当状态中某个 key对应的 状态未更新的时间达到阈值时, 该条状态被自动清理。

2023-03-08
1

每天一道大厂SQL题【Day14】微众银行真题实战(四)

大家好,我是Maynor。相信大家和我一样,都有一个大厂梦,作为一名资深大数据选手,深知SQL重要性,接下来我准备用100天时间,基于大数据岗面试中的经典SQL题,以每日1题的形式,带你过一遍热门SQL题并给出恰如其分的解答。...

2023-03-08
1

apache hudi 0.13.0版本重磅发布

Apache Hudi 0.13.0引入了一系列新特性,包括Metaserver, Change Data Capture, new Record Merge API, new sources for Deltastreamer等。虽然此版本不需要表版本升级,但希望用户在使用 0.13.0 版本之前按照下面的迁移...

2023-03-07
1

腾讯云发布国内首个云原生智能数据湖产品图谱,构建一体化数据湖服务

腾讯云大数据产品中心副总经理雷小平表示:“伴随着企业对于数据洞察敏捷度要求的不断提升,腾讯云正在不断探索更智能、更灵活、更高性价比的大数据工具。我们看到,数据湖架构已经成为在数据智能时代的新趋势,而云是数据湖...

2023-03-07
1