最新 最热

MATLAB、R用改进Fuzzy C-means模糊C均值聚类算法的微博用户特征调研数据聚类研究

本文就将采用改进Fuzzy C-means算法对基于用户特征的微博数据进行聚类分析。

2022-12-08
1

机器学习的通俗讲解

机器学习人人都在谈论,但除了老师们知根知底外,只有很少的人能说清楚怎么回事。如果阅读网上关于机器学习的文章,你很可能会遇到两种情况:充斥各种定理的厚重学术三部曲(我搞定半个定理都够呛),或是关于人工智能、数据科学...

2022-12-07
1

时间序列中的轨迹聚类

时间序列的聚类在时间序列分析中是非常重要的课题,在很多真实工业场景中非常有用,如潜在客户的发掘,异常检测,用户画像构建等。不同于一般样本聚类方式,时间序列因为其独特的时变特性,很多研究者都在探寻如何对其轨迹进行聚...

2022-12-04
1

SciPyCon 2018 sklearn 教程(下)

在前面的章节和笔记本中,我们将数据集分为两部分:训练集和测试集。 我们使用训练集来拟合我们的模型,并且我们使用测试集来评估其泛化能力 - 它对新的,没见过的数据的表现情况。...

2022-12-02
1

Python 数据科学手册 5.2 Scikit-Learn 简介

有几个 Python 库提供一系列机器学习算法的实现。最著名的是 Scikit-Learn,一个提供大量常见算法的高效版本的软件包。 Scikit-Learn 的特点是简洁,统一,流线型的 API,以及非常实用和完整的在线文档。这种一致性的好处是,...

2022-12-01
1

python高级在线题目训练-第二套·主观题

请用Python统计小说《Walden》 中各单词出现的频次,并按频次由高到低排序。

2022-11-30
0

基于Spark的机器学习实践 (九) - 聚类算法

◆ 计算每个样本与聚类中心的距离,样本选择最近的聚类中心作为其 类别;重新选择聚类中心

2022-11-30
1

一文读懂!异常检测全攻略!从统计方法到机器学习 ⛵

异常值是偏离数据集中大多数样本点的数据点。出现异常值的原因有很多,例如自然偏差、欺诈活动、人为或系统错误。不过,在我们进行任何统计分析或训练机器学习模型之前,对数据检测和识别异常值都是必不可少的,这个预处理的...

2022-11-29
1

Nat. Commun. | 用于单细胞测序的林火聚类将迭代标签传播与并行蒙特卡洛模拟相结合

本文介绍由美国耶鲁大学统计与数据科学系的Mark Gerstein通讯发表在 Nature Communications 的研究成果:作者介绍了林火聚类,这是一种从单细胞数据中发现细胞类型的有效手段,具有良好的可解释性。林火聚类采用最小的先验...

2022-11-28
0

ArcGIS空间分析笔记(汤国安)

2.在ArcCatalog 目录树中,右键单击载入数据库的要素类或表,选择加载——加载数据,打开简单数据加载程序向导。

2022-11-28
1