最新 最热

OneR 算法实现分类

分类是数据挖掘中最常用的方法之一,不论是实际应用还是科研,都少不了它的身影。对于分类问题我们通常能拿到表示实际对象或事件的数据集,我们知道数据集中每一条数据所属的类别,这些类别把一条条数据划分为不同的类。什么...

2019-07-26
0

他怎么追个剧都能看出「大数据」来?

听说最近《长安十二时辰》比较火,于是趁着一个周末赶紧补一补剧。相信很多人都对其中的"大案牍术"比较感兴趣,靖安司说"大案牍术"选中了张小敬。...

2019-07-25
0

气象遇见机器学习

近些年来关于人工智能(AI)、机器学习(machine learning)、深度学习(deep learning)的新闻数不胜数。各领域也都高举人工智能大旗,试图利用机器学习,深度学习等技术解决行业内的问题,拓展新业务。尤其是在图像识别、语言识别等...

2019-07-24
0

python与地理空间分析(一)

在气象数据分析中,地理空间要素是一个必须考虑的关键特征项,也是重要的影响因素。例如气温会随着海拔的升高而降低,地形的坡向朝向也会影响风速的分布,此外,典型的地形会形成特定的气候条件,也是数据挖掘中可以利用的区域划...

2019-07-24
0

身怀数据分析硬技能,对裁员说“NO”!

因为数据分析是大势所趋,未来的发展空间会大有可为。随着5G网络即将商用,企业每天将会产生海量的数据,BAT日均数据更是达到了PB的级别,数据分析相关岗位才会存在着巨大的需求缺口。...

2019-07-22
0

Kaggle "$70000奖金池" 竞赛经历分享 — Home Credit 房屋信贷违约风险(一)

推荐导读:本文来源于知识星球中一位星友的投稿,主要分享前不久刚结束的一个Kaggle竞赛 “Home Credit Default Risk” 房屋借贷的违约预测分析。

2019-07-22
0

深入浅出大数据:到底什么是Hadoop?

1998年9月4日,Google公司在美国硅谷成立。正如大家所知,它是一家做搜索引擎起家的公司。

2019-07-22
1

中科院宗成庆谈文本数据挖掘

AI 科技评论按,近年来,随着移动通信和互联网技术的快速发展与普及应用,数据挖掘技术得到了越来越多的关注。文本数据挖掘作为自然语言处理、机器学习和数据挖掘等多种技术的交叉研究领域,其研究热度也逐年提升。在学术界,...

2019-07-22
0

在几秒钟内将数千个类似的电子表格文本单元分组

第1,3和5行可能指的是拼写和格式略有偏差的同一个人。在小型数据集中,可以手动清洁细胞。但是在庞大的数据集中呢?如何梳理成千上万的文本条目并将类似的实体分组?...

2019-07-22
0

在印度展开全球文献数据挖掘,美国专家的大胆做法登上Nature

Carl Malamud 站在服务器前,他的团队准备对 7300 万篇论文进行数据挖掘。

2019-07-19
0