最新 最热

用通俗的语言解释下:Spark 中的 RDD 是什么

RDD,学名可伸缩的分布式数据集(Resilient Distributed Dataset)。初次听闻,感觉很高深莫测。待理解其本质,却发现异常简洁优雅。本文试图对其进行一个快速侧写,试图将这种大数据处理中化繁为简的美感呈现给你。...

2022-12-07
1

数据分享|R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据

最近我们被客户要求撰写关于混合效应广义线性模型的研究报告,包括一些图形和统计输出。本教程为读者提供了使用频率学派的广义线性模型(GLM)的基本介绍。具体来说,本教程重点介绍逻辑回归在二元结果和计数/比例结果情况下...

2022-12-06
0

Tapdata 杨哲轩:如何在零售行业实施主数据治理?

今天想和大家聊聊如何选择主数据管理方案。在上一篇文章里,我们谈到了数据孤岛形成的原因,简单地介绍了主数据管理的概念和主数据管理为何能发挥作用。...

2022-12-06
0

Tapdata 开源项目基础教程:功能特性及实操演示

自开源以来,Tapdata 吸引了越来越多开发者的关注。随着更多新鲜力量涌入社区,在和社区成员讨论共创的过程中,我们也意识到在基础文档之外,一个更“直观”、更具“互动性”的实践示范教程的重要性和必要性。为了辅助开发者...

2022-12-06
0

软件定义汽车时代,云计算成幕后重要推手

作为中国经济发展的“中流砥柱”,汽车产业正在发生着显著变化,以电动化、智能化、网联化和共享化为代表的汽车产业“新四化”,已经被公认为汽车行业的未来趋势。...

2022-12-06
1

腾讯云存储产品全线升级,满足更多高性能存储场景

导语 | 数字经济时代,诞生了海量数据资源,促使数据存储技术也在不断推陈出新。12月1日,在2022腾讯全球数字生态大会存储专场上,腾讯云发布了多款云存储产品能力上新,并对分布式存储、高性能存储、日志大数据、云原生数据...

2022-12-06
1

腾讯云数据万象:智能+存储双驱动,数倍提升内容生产效能

2022导语伴随数字经济市场稳步扩张, AI和富媒体融合的场景式体验、营销模式、分享渠道已经成为数字商业中不可或缺的部分。12月1日,在2022腾讯全球数字生态大会存储专场,腾讯云数据万象发布产品更新,与腾讯云对象存储COS...

2022-12-06
1

官方推荐:6种Pandas读取Excel的方法,正确答案都写在源代码里了~太方便了

不仅是我们Python开发,很多其它行业的朋友也经常使用Python中的Pandas这个库进行Excel的数据处理。

2022-12-06
0

用 Python 自动生成数据日报!

对于管理者来说,日报是事前管理的最好抓手,可以了解团队的氛围和状态。可对于员工来说,那就有的聊了。对于重复性的工作,我非常推荐大家使用Python将其变成模块化、自动化,帮助我们实现高效办公。...

2022-12-06
0

数据资产与治理:浅谈数据血缘的作用与价值

在数据资产管理与数据治理领域,数据之间的血缘关系是一个绕不开的话题,数据血缘的完备程度也是评价一个企业数据中台成熟度的重要度量之一。到底什么是数据血缘,它对于数据工作者和数据使用者有哪些举足轻重的作用呢?...

2022-12-05
1