> 文章列表 > 【python】常用聚类算法:K-Means 聚类、MeanShift 聚类、层次聚类、

【python】常用聚类算法:K-Means 聚类、MeanShift 聚类、层次聚类、

【python】常用聚类算法:K-Means 聚类、MeanShift 聚类、层次聚类、

前提回顾:
问题
(1) 采用合理的分类模型,采用如逻辑回归、K 近邻、决策树、朴素贝叶斯、支持向量机等,建立该问题的分类预测模型,通过评价指标说明建立的模型优劣;
(2) 将上问题中关于客户汽车满意度原始数据集的标签去除,进行聚类分析,采用如:K-Means 聚类、MeanShift 聚类、层次聚类、DBSCAN 等聚类模型,采用合理的模型和参数获得聚类结果,通过评价指标说明建立的模型优劣,并将聚类结果与原来的分类结果进行比较。

1 聚类

聚类是一种无监督学习方法,其目的是将相似的数据样本划分为若干个簇,使得每个簇内的数据样本相似度较高,而不同簇之间的相似度较低。将问题中关于客户汽车满意度原始数据集的标签去除,然后进行聚类分析。
【python】常用聚类算法:K-Means 聚类、MeanShift 聚类、层次聚类、

1.1 K-Means 聚类

K-Means基本思想是通过计算每个数据样本与簇中心的距离,将样本归属于距离最近的簇。通过迭代更新簇中心和重新划分样本,最终得到簇的划分结果。

1.2 MeanShift 聚类

MeanShift主要思想是通过计算样本点周围的密度,不断移动样本点的位置,最终达到簇内样本密度最大的位置。

1.3 层次聚类

层次聚类是一种基于树形结构的聚类算法,其主要思想是通过不断合并相似的簇,形成层次结构的聚类树。

2 轮廓系数评估