一、什么是聚类分析 聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。它是一种重要的人类行为。 聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。 ——《百度百科–聚类分析》
从机器学习的角度看,聚类是一种无监督的机器学习方法,即事先对数据集的分布没有任何的了解,它是将物理或抽象对象的集合组成为由类似的对象组成的多个类的过程。
二、常见算法 (1)K-means算法 (2)一趟聚类算法 (3)层次聚类算法 (4)两步聚类算法
三、友情链接 (1)聚类分析(K-means算法) https://blog.csdn.net/wsp_1138886114/article/details/80475981
(2)用K-Means聚类分析做客户分群 https://www.cnblogs.com/niniya/p/8784947.html
此外,多使用IBM SPSS Modeler对数据进行聚类分析: (1)IBM SPSS Modeler 教程 https://wenku.baidu.com/view/04162a08a26925c52dc5bf1a.html
(2)SPSS Modeler 入门(一) https://blog.csdn.net/su_2018/article/details/83869325
(3)数据挖掘产品 IBM SPSS Modeler 新手使用入门 https://blog.csdn.net/liusongping123/article/details/83896352
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/183917.html原文链接:https://javaforall.cn