• 北大核心期刊(《中文核心期刊要目总览》2017版)
  • 中国科技核心期刊(中国科技论文统计源期刊)
  • JST 日本科学技术振兴机构数据库(日)收录期刊

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于最小生成树的层次K-means聚类算法

贾瑞玉 李振

贾瑞玉, 李振. 基于最小生成树的层次K-means聚类算法[J]. 微电子学与计算机, 2016, 33(3): 87-89, 94.
引用本文: 贾瑞玉, 李振. 基于最小生成树的层次K-means聚类算法[J]. 微电子学与计算机, 2016, 33(3): 87-89, 94.
JIA Rui-yu, LI Zhen. The Level of K-means Clustering Algorithm Based on the Minimum Spanning Tree[J]. Microelectronics & Computer, 2016, 33(3): 87-89, 94.
Citation: JIA Rui-yu, LI Zhen. The Level of K-means Clustering Algorithm Based on the Minimum Spanning Tree[J]. Microelectronics & Computer, 2016, 33(3): 87-89, 94.

基于最小生成树的层次K-means聚类算法

基金项目: 

国家自然基金项目 61202227

详细信息
    作者简介:

    贾瑞玉    女, (1965-), 副教授, 硕士生导师.研究方向为智能计算与数据挖掘.E-mail: 764702886@qq.com

    李振    男, (1991-), 硕士生.研究方向为数据挖掘

  • 中图分类号: TP301.6

The Level of K-means Clustering Algorithm Based on the Minimum Spanning Tree

  • 摘要:

    针对K-means算法初始化时需要指定聚类数目, 和随机选择初始聚类中心对聚类结果产生不稳定的问题, 结合图论中最小生成树和层次算法的分裂、凝聚思想, 提出一种基于最小生成树的层次K-means算法.该算法初始时根据数据样本生成一颗最小生成树, 然后利用层次分裂思想把数据分成多个较小的簇, 通过K-means算法迭代操作得到每次操作的评价函数值来判断是否进行簇的合并, 进一步确定聚类簇数目.实验结果证明, 该算法能够较准确地判断聚类数目, 并且聚类结果的稳定性比基本K-means算法要好.

     

  • 图 1  聚成不同数目簇变化曲线

    (注:由于进行合并操作,所以在图1中随着聚类数目的减小来进行观察.为了能在同一图中反映所有数据,我们对I值进行的了除10处理)

    图 2  Iris数据集

    图 3  Wine数据集

    图 4  Glass数据集

    表  1  实验数据集

    数据集 数据个数 属性值
    Iris 150 4
    Wine 178 13
    Glass 214 9
    下载: 导出CSV

    表  2  100次试验J

    算法数据集 Iris Wine Glass
    K-means算法 最大值 149.52 18 436.95 259.7
    最小值 97.32 16 530.58 213.22
    平均值 111.576 17 343.54 236.86
    改进层次K-means 最大值 97.34 16 555.68 220.34
    最小值 97.19 16 480.97 213.69
    平均值 97.227 16 541.99 217.97
    下载: 导出CSV
  • [1] 雷小锋, 谢昆青, 林帆, 等. 一种基于K-Means局部最优的高效聚类算法[J]. 软件学报, 2008, 19(7): 1683-1692. https://www.cnki.com.cn/Article/CJFDTOTAL-RJXB200807014.htm
    [2] 贺玲, 吴玲达, 蔡益朝. 数据挖掘中的聚类算法综述[J]. 计算机应用研究, 2007, 23(1): 10-13. https://www.cnki.com.cn/Article/CJFDTOTAL-JSYJ200701002.htm
    [3] 孙吉贵, 刘杰, 赵连宇. 聚类算法研究[J]. 软件学报, 2008, 19(1): 48-61. https://www.cnki.com.cn/Article/CJFDTOTAL-RJXB200801009.htm
    [4] 胡伟. 改进的层次K均值聚类算法[J]. 计算机工程与应用, 2013, 49(2): 157-159. https://www.cnki.com.cn/Article/CJFDTOTAL-JSGG201302041.htm
    [5] 徐沁, 罗斌. 结合means-shift与MST的K-means聚类算法[J]. 计算机工程, 2013, 39(12): 214-210. https://www.cnki.com.cn/Article/CJFDTOTAL-JSJC201312045.htm
    [6] Galluccio L, Michel O, Comon P, et al, Graph based kmeans clustering[J]. Signal Processing, 2012, 92(9): 1970-1984.
    [7] 李翔宇, 王开军, 郭躬德. 基于网格最小生成树的聚类算法选择[J]. 模式识别与人工智能, 2013, 26(1): 34-41. https://www.cnki.com.cn/Article/CJFDTOTAL-MSSB201301010.htm
  • 加载中
图(4) / 表(2)
计量
  • 文章访问数:  979
  • HTML全文浏览量:  259
  • PDF下载量:  26
  • 被引次数: 0
出版历程
  • 收稿日期:  2015-05-20
  • 修回日期:  2015-06-25

目录

    /

    返回文章
    返回