下你所需,载你所想!
汇集开发技术源码资料

K-Means聚类算法,数据类型

:659.247KB :1 :2022-01-08 14:53:57

部分简介

K-Means聚类算法,数据类型如果开发者对于本文件有需要的可以参考,K-Means 算法是典型的基于距离的非层次聚类算法,在最小化误差函数的基础上将数据划分为预定的类数 K,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。 K-Means 聚类算法中,一般需要度量样本之间的距离、样本与簇之间的距离以及簇与簇之间的距离。度量样本之间的相似性最常用的是欧几里得距离、曼哈顿距离和闵可夫斯基距离。

算法过程:

1)从 N 个样本数据中随机选取 K 个对象作为初始的聚类中心;

2)分别计算每个样本到各个聚类中心的距离,将对象分配到距离最近的聚类中;

3)所有对象分配完成后,重新计算 K 个聚类的中心;

4)与前一次计算得到的 K 个聚类中心比较,如果聚类中心发生变化,转2),否则转5);

5)当质心不发生变化时停止并输出聚类结果。

热门推荐

相关文章