最新 最热

2021年大数据基础(四):​​​​​​​​​​​​​​​​​​​​​大数据业务分析基本步骤

明确数据分析目的以及确定分析思路,是确保数据分析过程有效进行的先决条件,它可以为数据的收集、处理及分析提供清晰的指引方向。

2021-10-11
0

2021年大数据Hadoop(三):Hadoop国内外应用

Yahoo是Hadoop的最大支持者,Yahoo的Hadoop机器总节点数目已经超过42000个,有超过10万的核心CPU在运行Hadoop。最大的一个单Master节点集群有4500个节点(每个节点双路4核心CPUboxesw,4×1TB磁盘,16GBRAM)。总的集群存储容量...

2021-10-11
0

Pandas高级教程之:时间处理

时间应该是在数据处理中经常会用到的一种数据类型,除了Numpy中datetime64 和 timedelta64 这两种数据类型之外,pandas 还整合了其他python库比如scikits.timeseries中的功能。...

2021-10-11
1

NLP中关键字提取方法总结和概述

关键字提取是从文本文档中检索关键字或关键短语。这些关键词从文本文档的短语中选择出来的并且表征了文档的主题。在本文中,我总结了最常用的自动提取关键字的方法。...

2021-10-09
0

KDD 2021 | 多维时间序列无监督异常检测方法

异常检测是监控实体(如制造系统和互联网服务)各种状态(即指标)的一项关键任务,这些实体的监控数据一般都是多维时间序列。在真实工业场景中,异常检测常常缺少足够的标签,如何对多维时间序列进行无监督的异常检测是一个非常重...

2021-10-09
0

【教程】纯原生异步特性,教你用JavaScript快速获取壁纸站

切记请勿用于违法用途,一切后果与作者无关!请尊重原作者著作权,除学习外禁止未经同意随意抓取数据,禁止应用于商业化行为!

2021-10-08
1

【APT行为数据分析】终端溯源数据中的依赖爆炸问题

高级持续性威胁(Advanced Persistent Threat,APT)具有对抗性、隐匿性、低频性、持续性,在配合复杂、定制化的技战术手段,给传统防护检测方案带来挑战。为提升高级威胁分析的时效性,降低狩猎门槛,探索通过数据驱动的方式提升...

2021-09-27
1

企业如何搭建真正能创造价值的数据分析体系?

导言:地产企业面临着独特的数字化转型难题:业务广泛、资源庞杂、管理琐碎,导致了数据体系的凌乱,没有使数据资产真正发挥应有的价值。如何将数据分析工作真正的聚焦到企业独特的业务发展需求上?这篇文章告诉你。...

2021-09-26
1

特征选择与提取最全总结之过滤法

特征抽取是数据挖掘任务最为重要的一个环节,一般而言,它对最终结果的影响要高过数据挖掘算法本身。

2021-09-26
1

花钱办活动效果不明?零售企业应该这样量化促销活动成效

问题:费时费力的花钱举办了一场打折优惠促销活动,可是零售商家如何知道活动办得好不好?

2021-09-23
0