最新 最热

数据开发/数仓工程师上手指南(七)CDM-DWS层搭建规范及流程

进入到了CMD公共数据层的结尾最后一层-DWS层了,该层基本就是直接与业务强关联,也就是说产品提出的需求,或是报表、用户画像统计好还是数据大屏都是在这一层给处理好数据,再放入ADS层,然后我们只需要在BI里面配备对应的数据...

2024-08-05
1

腾讯云位居 IDC MarketScape 中国实时湖仓市场“领导者”类别

IDC MarketScape 厂商评估模型旨在为特定市场中信息和通信技术(ICT)厂商的竞争力提供一个概述。研究方法采用严格的定性和定量的标准的评分方法,以单一的图形说明每个厂商在特定市场中的位置。IDC MarketScape 提供了一...

2024-08-05
1

常见大数据面试SQL-有序行转列

有学生各学科分数表,记录了学生的各科分数,请按照学生粒度,生成两列数据分别为学科和分数,要求学科内的顺序与分数顺序一致。

2024-08-01
1

常见大数据面试SQL-max_by(x,y)处理缺失值

现有用户账户表,包含日期、用户id、用户余额,其中用户余额发生了缺失,需要进行补全。补全规则:如果余额为空则取之前最近不为空值进行填补。如果截止到最早日期都为空则补0;...

2024-08-01
3

大数据面试SQL-奖金瓜分问题

在活动大促中,有玩游戏瓜分奖金环节。现有奖金池为 10000元,代表奖金池中的初始额度。用户的分数信息如下表。表中的数据代表每一个用户和其对应的得分,user_id 和 score 都不会有重复值。瓜分奖金的规则如下:按照 score ...

2024-08-01
1

【建议收藏】大数据Hadoop实战入门手册,配套B站视频教程1小时速通

大数据技术是一组用于处理、存储和分析大规模数据集的技术和工具。随着数字化时代的到来,数据量的爆炸性增长使得传统的数据处理和分析方法变得不够高效,因此大数据技术应运而生。...

2024-07-31
1

腾讯云 ES 8 向量化语义混合检索一站式体验指南

本文描述问题及解决方法同样适用于 腾讯云 Elasticsearch Service(ES)。

2024-07-30
2

解密hash算法:散列表、布隆过滤器和分布式一致性hash的原理与应用

了解平衡二叉树: 平衡二叉树查找数据采用二分查找,每次查找排除一半。平衡的目的是增删改之后,保证下次搜索能够稳定排除一半的数据。

2024-07-29
3

百行代码实现 Kafka 运行在 S3 之上

是的,你没有看错。AutoMQ1 当前已经支持完全构建于像 S3 这样的对象存储之上。你可以参考快速上手3 即刻开始体验。AutoMQ 在已有的流存储引擎之上仅仅通过对顶层 WAL 的抽象进行拓展实现少量代码即可做到一些友商引以...

2024-07-29
3

活动回顾 | AutoMQ 联合 GreptimeDB 共同探讨新能源汽车数据基础设施

7 月 13 日,AutoMQ 携手 GreptimeDB“新能源汽车数据基础设施” 主题 meetup 在上海圆满落幕。本次论坛多角度探讨如何通过创新的数据管理和存储架构,提升汽车系统的性能、安全性和可靠性,从而驱动行业的持续发展和创新,...

2024-07-29
2