最新 最热

达观数据:如何利用社会化聆听挖掘有价值的商业情报(上篇)

现在,社交媒体数据挖掘领域有一个发展趋势,即客户需求逐渐由追求数据规模、浅层描述统计的舆情分析转向追求数据质量、深度挖掘信息价值的情报分析。...

2020-04-03
0

万字长文综述:给你的数据加上杠杆——文本增强技术的研究进展及应用实践

文章系统性地回顾了自然语言处理领域中的文本增强技术在近几年的发展情况,重点列举和讨论了 18 年、19 年中人们常用的五类文本增强技术路径以及对应的代表性技术。接下来,文章以金融领域的自然语言处理任务入手,多维度...

2020-04-02
1

听说数据分析师挺火,我们来数据分析一下

经常看见各种数据分析师培训的运营推荐,那么数据分析师的就业行情究竟如何?让我们用数据说话,一探究竟!

2020-04-01
0

哈医大生信中心的脑瘤单细胞数据挖掘

作者下载了Patel et al. (2014)发表的GSE57872).在里面的 576 cells 自己走了一遍CNV分析,拿到了350 tumor cells.进行聚类,结果如下:

2020-03-30
0

数据科学的下一次火爆:数据科学指导的创新策略(CS CY)

随着数据挖掘的研究和应用不断扩展到医学、金融、安全等各个领域,人们清楚地感受到对多样化人才的需求。随着大数据在联邦、私人和学术领域的推广,在国内和国际上提供了大量的机会,这种情况尤为明显。BPDM讲习班是7年多...

2020-03-26
0

「自然语言处理(NLP)」一文带你了解TF-IDF

今天看了一下网上关于TF-IDF的文章,但是相关文章的知识点比较分散,所以作者对这些分散的知识进行了梳理整合,希望本文能够让你很快了解TF-IDF到底是什么,为什么会存在,以及其优缺点?...

2020-03-25
0

RS(2)--从文本数据到用户画像

用户画像其实就是从海量的用户数据中,建模抽象出来每个用户的属性标签体系,这些属性通常需要具有一定的商业价值。

2020-03-25
1

R语言做数据挖掘4本电子书

曾几何时,我在一次面试中,面试官问,“数据挖掘和机器学习有什么区别?”,朋友们也可以思考下这个问题。

2020-03-25
1

实战 | Elasticsearch自定义评分的N种方法

比如:同样输入“锤子”,工匠期望的是钉子对应的“锤子”,老罗的粉丝期望的是“锤子科技”、“锤子便签”、“锤子手机”等。

2020-03-18
0

EM算法求解pLSA主题模型

说到主题模型通常会想到LDA主题模型。确实,近些年出现的主题模型或多或少与LDA模型存在联系,但是今天我们要介绍的是比LDA还要早的pLSA主题模型。

2020-03-17
0