最新 最热

Facebook的新开源项目Velox,有点命运多舛啊。。。

本文首发微信公众号:飞总聊ITVelox是Facebook(Meta)开源的一个新的大数据项目。今年VLDB的会议上,Velox团队也发了论文。我每年都有阅读论文的习惯,一般就是看看SIGMOD/VLDB,之前也去开会,疫情以后这方面都懈怠了。今年的VL...

2022-10-09
1

300万数据导入导出优化方案,从80s优化到8s(实测)

点击上方“芋道源码”,选择“设为星标”管她前浪,还是后浪?能浪的浪,才是好浪!每天 10:33 更新文章,每天掉亿点点头发...源码精品专栏原创 | Java 2021 超神之路,很肝~中文详细注释的开源项目RPC 框架 Dubbo 源码解析网络...

2022-10-09
1

图数据库和知识图谱在微财风控系统中的探索和应用

来源:AI前线本文约3500字,建议阅读7分钟本文为你介绍图数据库作为复杂关系网络分析的一个强有力的工具在微财风控系统中的探索和应用。近年来随着监管力度的不断提升,金融机构业务的不断发展,交易方式越发便利的背景下。...

2022-10-09
0

秒换存储引擎,又多了一种架构方案? | 数据库系列

在做业务架构的过程中,你是否遇到过类似的痛点?(1)数据量太大,容量复杂性上移到业务层;(2)并发量太大,性能复杂性上移到业务层;(3)前台与后台存储异构,满足不同查询需求;(4)线上与线下存储异构,满足大数据需求;(5)存储系统迁移成本高,不敢...

2022-10-08
0

数据治理体系全面指南

好的数据治理体系可以盘活整条数据链路,最大化保障企业数据的采集、存储、计算和使用过程的可控和可追溯。

2022-10-05
1

最容易出错的 Hive Sql 详解

在进行数仓搭建和数据分析时最常用的就是 sql,其语法简洁明了,易于理解,目前大数据领域的几大主流框架全部都支持sql语法,包括 hive,spark,flink等,所以sql在大数据领域有着不可替代的作用,需要我们重点掌握。...

2022-10-05
1

微信真能查到别人的聊天记录?

坐拥十多亿用户的微信仍不乏诸多槽点,其中一个就是聊天记录同步,每次换手机最麻烦的可能就是动辄十几GB甚至上百GB的聊天记录迁移了。同时不少人对于微信聊天数据的存储有所担忧,会不会某天泄露出去?或者聊天被监视?...

2022-10-05
0

字节跳动基于 Apache Hudi 构建实时数仓的实践

导读:今天很高兴能与大家分享字节数据平台在实时数仓中的一些实践。目前在数据湖和Hudi相关的一些基本技术原理方面社区已有较多的介绍,所以我们今天的分享主要聚焦于实践部分的内容。...

2022-10-05
1

Flink本地模式安装和使用

不同版本的Flink对JDK版本要求不尽相同,需要根据具体的Flink版本要求先安装好JDK环境。 通常,在Flink的Release Notes中有对应JDK版本的说明,如:Release Notes for Flink 1.15 ,要求安装JDK11。 下载JDK 并进行安装配置。...

2022-10-05
1

对中台的探索与思考

中台概念如今已经不是什么新的名词了,相信大家对中台都有所耳闻,目前各大企业已经先后开始建设自己的中台。

2022-10-05
1