最新 最热

邱泽奇 | 大数据给社会学研究带来了什么挑战?

这篇文章是根据2015年5月29日邱泽奇教授在北京大学社会学系的一个讲座整理而成。为了缩短篇幅,在整理中删除了重复的、缺乏信息的内容。

2022-04-01
0

湖仓一体详解

问题导读1.什么是数据仓库、数据集市和数据湖?2.湖仓一体化为什么诞生?3.湖仓一体化是什么?4.湖仓一体化的好处是什么?0.沃尔玛纸尿裤和啤酒在了解湖仓一体化之前,我们先来看一则有关数据仓库的有趣故事吧~沃尔玛拥有世界...

2022-03-31
1

TASKCTL用户权限如何设置

​admin用户是系统自带的超级用户, 但我们不建议你用admin用户登录使用Designer、Monitor组件。通过Admin(平台管理组件),为每个用户建立独立的用户,是使用TASKCTL的良好习惯。...

2022-03-31
1

【数据管理】OLAP 与 OLTP:有什么区别?

这些术语经常相互混淆,那么它们的主要区别是什么?您如何根据自己的情况选择合适的术语? 我们生活在一个数据驱动的时代,使用数据做出更明智决策并更快响应不断变化的需求的组织更有可能脱颖而出。您可以在新的服务产品(例...

2022-03-31
0

数据集 | 成人收入预测数据集

个人的年收入是由多种因素造成的。从直观上看,它受个体的教育程度、年龄、性别、职业等因素的影响这些数据是。这些数据由Ronny Kohavi和Barry Becker(数据挖掘和可视化,Silicon Graphics)从美国某地区1994年的人口普查...

2022-03-30
1

[Python从零到壹] 十五.文本挖掘之数据预处理、Jieba工具和文本聚类万字详解

欢迎大家来到“Python从零到壹”,在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解,真心想把自己近十年的编程经验分享给大家,希望对...

2022-03-30
1

TASKCTL调度监控平台资源树刷新、重载和重置的区别

调度核心为了对该信息有效管理以及使用,主要通过开发区、工作区、以及共享内存对其分别管理,其关系如下:

2022-03-30
1

[NLP]TFIDF算法简介

词频-逆文档频率(Term Frequency-Inverse Document Frequency,TF-IDF)是一种常用于文本处理的统计方法,可以评估一个单词在一份文档中的重要程度。简单来说就是可以用于文档关键词的提取。...

2022-03-29
0

数据资产目录建设实践

企业数据资产的数据管理需要数据资产框架来支撑数据资产的展示、记录、分析,通过数据资产框架可以明晰企业拥有的数据资产、实现数据资产安全分享、提升数据资产质量、实现数据资产变现等数据管理目标。...

2022-03-29
0

温故知新:数据科学札记

【引子】春节聊天的时候,家中少年的一个发小刚刚转了个专业——数据科学,自己似乎对所谓的”数据科学“了解很多,但又似乎难以区分其中的一些概念差异,例如,统计学与数据科学的区别,,数据分析与数据科学的差异...

2022-03-29
0