最新 最热

自然语言处理 NLP(3)

1、开始时每个样本各自作为一类; 2、规定某种度量作为样本间距及类与类之间的距离,并计算; 3、将距离最短的两个类聚为一个新类; 4、重复2-3,不断聚集最近的两个类,每次减少一个类,直到所有样本被聚为一类;...

2022-06-15
0

数学建模学习笔记(七)TF-IDF算法提取关键词

TF-IDF算法数学表达: 术语频率(TF)是指给定单词在文档中出现的次数,经过归一化后,我们可以用以下公式表示:

2022-06-14
0

为什么企业总是很难真正做到“数据驱动决策”?

随着诸多企业数字化转型进入成熟期和收获期,数据的应用也愈发广泛和深入,不仅仅局限于数据的可视化展示,如报表、看板等,更要求可以真正推动业务科学发展,其中“科学决策”成为了关键之一。...

2022-06-13
1

算法工程师之死

——作为一个经常和传统企业打交道的乙方,这种抱怨陈老师听得太多了,类似惨痛画面也见得太多了。今天我们系统说说。

2022-06-13
1

从屡遭拒稿到90后助理教授,罗格斯大学王灏:好奇心驱使我不断探索

AMiner × 量子位 联合出品编者按:王灏,现为罗格斯大学计算机系助理教授。一路从上海交大,到香港科技大学,再到MIT,他的学术之旅看上去是“轻装上阵”,一路意气风发。但实际上,入行于机器学习尚未得重视的年代,他也曾遇到论文...

2022-06-10
0

R包更新过程中readr和cli不匹配

下面是学员解决问题的记录(生信技能树学员 )

2022-06-08
0

学习match函数的记录

我们的生信入门班和数据挖掘线上直播课程已经有了三年多的历史,培养了一波又一波优秀的生信人才,前面我们也发了不少学生的笔记和感悟,这一次想给大家展示一个优秀的“后浪”在老师的启发下自行思考和探索求知的例子,我们...

2022-06-08
0

GEO数据库挖掘之多个芯片数据集的合并

下面是( GEO数据挖掘 )直播配套笔记举例:GSE83521和GSE89143数据合并1.下载数据rm(list = ls())library(GEOquery)library(stringr)gse = "GSE83521"eSet1 <- getGEO("GSE83521", ......

2022-06-08
1