最新 最热

离在线一体 引擎一体化 云原生

OLAP 是一个很卷的赛道,创业公司也众多。在本文中,笔者基于 10+ 年的大数据与数据仓库的工作经验,就目前的主流趋势:离在线一体化、引擎一体化、云原生化等写一些思考,抛砖引玉,希望能与各位共同探讨。...

2023-09-09
2

Hudi:数据湖技术引领大数据新风口

Apache Hudi(Hadoop Upserts Delete and Incremental)是下一代流数据湖平台。Apache Hudi将核心仓库和数据库功能直接引入数据湖。Hudi提供了表、事务、高效的upserts/delete、高级索引、流摄取服务、数据集群/压缩优化...

2023-07-25
1

现代数据架构选型:Data Fabric、Data Mesh | QCon

作者|QCon数据架构总是在更新迭代的路上,以使其快速适应变化的数据环境,更为敏捷和规模化地给业务部门交付数据。在传统的数据架构中,存在数据复杂度高、缺乏敏捷性、不便于协作、数据和一致性可解释性低下等问题。这些挑...

2023-03-29
1

数据湖选型指南|Hudi vs Iceberg 数据更新能力深度对比

数据湖作为新一代大数据基础设施,近年来持续火热,许多前线的同学都在讨论数据湖应该怎么建,许多企业也都在构建或者计划构建自己的数据湖。基于此,自然引发了许多关于数据湖选型的讨论和探究。但是经过搜索之后我们发现,网...

2023-03-17
2

腾讯云发布国内首个云原生智能数据湖产品图谱,构建一体化数据湖服务

腾讯云大数据产品中心副总经理雷小平表示:“伴随着企业对于数据洞察敏捷度要求的不断提升,腾讯云正在不断探索更智能、更灵活、更高性价比的大数据工具。我们看到,数据湖架构已经成为在数据智能时代的新趋势,而云是数据湖...

2023-03-07
1

实时数仓一般性总结

一般也不需要非常仔细地进行数据分层,数据直接通过Flink计算或者聚合之后将结果写MySQL/ES/HBASE/Druid/Kudu等,直接提供应用查询或者多维分析。

2023-03-06
2

腾讯云大数据荣获“2022技术卓越奖”,深入其背后的原因

随着数字经济的蓬勃发展,产业数字化进程持续推进,数据技术拥有了广泛的端到端应用场景,而借助数据技术可以实现从数据到信息、从信息到知识、从知识到决策的转换,助力实体经济的创新发展。IDC预计,到2026年,全球大数据市场...

2023-03-02
1

从hudi持久化文件理解其核心概念

这是hudi系列的第一篇文章,先从核心概念,存储的文件格式加深对概念的理解,后续再逐步对使用(spark/flink入hudi,hudi同步hive等)、原理(压缩机制,索引,聚族等)展开分享~...

2023-02-28
1

Apache Hudi 背后商业公司Onehouse宣布2500万美元A轮融资

自推出以来,我们与几位早期用户合作,将我们的产品愿景变为现实,并为他们的生产数据湖提供动力。我们的目标是在 lakehouse 技术之上提供云数据仓库堆栈的易用性和自动化,反过来也为用户提供急需的成本效益和性能优势。作...

2023-02-28
1

腾讯云DLC(数据湖计算)重磅支持Apache Hudi

数据湖计算 DLC 通过类 SaaS 化的服务设计,为客户提供云原生企业级敏捷智能数据湖解决方案,具备以下特点:

2023-02-28
1