最新 最热

Modern Data Stack 下 Data Integration 生态(上)

业界流行 modern data stack 的说法,本质上就是将传统的一些工具用 SaaS 化的思路在云上重新再做一遍,从来显著提升客户的使用难度。modern data stack 几大核心是:cloud 、open-source 、SaaS business models。...

2021-12-28
0

干货 | 携程度假数据治理之数据标准管理实践

本文分享的是数据标准管理在携程度假数据治理中的实践,希望对想要了解和学习数据治理实践的读者有所帮助,也希望能收获宝贵的建议。

2021-12-21
0

工程项目管理软件助力施工企业数字化管理

工程项目管理系统实现数字化管理。数据资产沉淀和分析,支撑组织决策。服务于企业阶段性目标的达成。以组织建设、人才选拔,人才复制,提升组织能力。...

2021-12-14
0

Hadoop(HDFS+MapReduce+Hive+数仓基础概念)学习笔记(自用)

文件中有两个配置,删除其中任意一个,修改剩下的一个配置将address改为系统新分配的mac地址,将NAME改成eth0,保存退出

2021-12-07
0

2021爱分析・数据智能平台实践报告-重构数据智能时代的数据基础设施

数据平台是支撑企业数字化转型,实现数据分析和数据应用的底层基础设施。通过应用数据平台,企业能够实现精细化运营,从而降低运营成本、提高运营效率、提升创新能力。...

2021-12-01
0

面向AI 的数据生态系统

人工智能已经从天花乱坠的宣传逐渐变成了现实。算法在机器学习和深度学习方面的进步,计算能力和存储能力的显著提高,以及数字化所产生的大量数据,使人工智能很可能改变所有行业的游戏规则。人工智能有潜力从根本上改进业...

2021-11-25
0

如何处理异构数据?明略科学院最新成果:基于图数据模型,定义数据统一完整流程

ACM CIKM全称为(ACM International Conference on Information and Knowledge Management),是国际计算机学会(ACM)主办的数据库、知识管理、信息检索领域的重要学术会议。11月1日至5日CIKM 2021将在线举行。...

2021-11-05
0

bioRxiv | SIMBA:基于图嵌入的单细胞特征提取模型

本文介绍由哈佛医学院Pinello实验室Luca Pinello等人发表于bioRxiv的论文:SIMBA: SIngle-cell eMBedding Along with features. 该论文提出了 SIMBA,这是一种单细胞嵌入方法,可将单细胞及其特征(例如基因、染色质可及区域...

2021-11-04
0

实时离线一体化技术架构(万字,15张图)

基于TB级的在线数据,支持缴费帐单明细在线查询。大家都知道,像银行帐单流水一样,查几年的流水是常有的事。

2021-10-22
0

端到端的实时计算:TiDB + Flink 最佳实践

孙晓光,PingCAP Community Development 团队负责人,原知乎基础研发团队架构师,长期从事分布式系统相关研发工作,关注云原生技术。

2021-09-26
0