最新 最热

Hive SQL 常用零碎知识

比如event_value是一个json格式的字段,然后想获取里面的id作为单独一列

2023-07-21
2

基于AIGC的写作尝试:Presto: A Decade of SQL Analytics at Meta(翻译)

Presto是一个开源的分布式SQL查询引擎,支持多个EB级数据源的分析工作负载。Presto用于低延迟的交互式用例以及Meta的长时间运行的ETL作业。它最初于2013年在Meta推出,并于2019年捐赠给Linux基金会。在过去的十年中,随着M...

2023-04-19
2

基于AIGC写作尝试:深入理解 Dremio

现代组织不断从各个来源产生和收集大量数据。数据可能存储在不同的格式、位置,并且在容量、速度和种类上可能存在差异,使用户难以快速提取其中的价值。数据孤岛在许多公司都是存在,为了解决数据孤岛问题,企业可以采取的措...

2023-04-17
2

这样回答前端面试题才能拿到offer_2023-03-15

Promise是可以链式调用的,由于每次调用 .then 或者 .catch 都会返回一个新的 promise,从而实现了链式调用, 它并不像一般任务的链式调用一样return this。

2023-03-15
2

探究Presto SQL引擎(4)-统计计数

本篇文章介绍了统计计数的基本原理以及Presto的实现思路,精确统计和近似统计的细节及各种优缺点,并给出了统计计数在具体业务使用的建议。

2022-11-01
2

唯品会亿级数据服务平台落地实践

数据服务是数据中台体系中的关键组成部分。作为数仓对接上层应用的统一出入口,数据服务将数仓当作一个统一的 DB 来访问,提供统一的 API 接口控制数据的流入及流出,能够满足用户对不同类型数据的访问需求。...

2022-10-27
4

【Presto源码学习】ResourceGroups调度策略

Presto目前支持对resource group配置不同的调度策略,来实现不同类型的调度,参考官方的文档:Resource Groups,相关内容如下所示:

2022-05-20
2

presto timestmp使用

日期和时间运算符

2021-10-18
2

解决Presto Coordinate单点故障的部署方案

presto虽然可以集群化部署,但是由于coordinate存在单点问题,商业化应用还是存在一定的问题,本文会给出一种简单的集群化部署方案,解决presto的单点问题。...

2019-08-28
3