论文:2016,Vol:34,Issue(5):863-866
引用本文:
马云红, 王成汗, 江腾蛟, 张堃. 一种基于数据包含度的自动聚类算法[J]. 西北工业大学学报
Ma Yunhong, Wang Chenghan, Jiang Tengjiao, Zhang Kun. An Automatic Clustering Algorithm Based on Data Contained Ratio[J]. Northwestern polytechnical university

一种基于数据包含度的自动聚类算法
马云红, 王成汗, 江腾蛟, 张堃
西北工业大学 电子信息学院, 陕西 西安 710072
摘要:
聚类分析是机器学习和模式识别领域的一个重要问题,聚类算法常用于解决这类问题。针对传统聚类算法运算量大、不适应任意分布数据聚类的不足,提出了一种基于数据包含度的自动聚类算法。该算法引入数据包含度的概念,能够自动确定聚类个数和聚类中心,并进一步采用跟随策略实现聚类。多组数据的实验验证了自动聚类算法的有效性。对不同分布的数据进行了自动聚类算法与K-means聚类算法的聚类结果比较,实验结果表明自动聚类算法具有很好的聚类性能。
关键词:    聚类算法    数据包含度    数据局部密度   
An Automatic Clustering Algorithm Based on Data Contained Ratio
Ma Yunhong, Wang Chenghan, Jiang Tengjiao, Zhang Kun
School of Electronics and Information, Northwestern Polytechnic University, Xi'an 710072, China
Abstract:
Cluster analysis is an important issue for machine learning and pattern recognition. Clustering algorithm is usually used in solving these problems. A novel automatic clustering algorithm is developed based on data contained ratio. In automatic clustering algorithm which is presented in this paper, the concept of data contained ratio is proposed, the cluster number can be determined automatically based on the data contained ratio, and the relative cluster centers are found similarly Several groups data are used to testify and demonstrate the validity and effectiveness of the cluster algorithm. In addition, the comparison between the traditional K-means cluster algorithm and automatic cluster algorithm is processed. The results demonstrate that the automatic cluster algorithm has high performance in clustering random distribution data set.
Key words:    clustering algorithm    data contained ratio    data local density   
收稿日期: 2016-03-05     修回日期:
DOI:
基金项目: 西北工业大学研究生创意创新种子基金(G2015KY0407)与国家自然科学基金青年基金项目(61401363)资助
通讯作者:     Email:
作者简介: 马云红(1972-),女,西北工业大学副教授、博士,主要从事人工智能优化算法、飞行器任务规划和智能控制、复杂系统建模与仿真的研究。
相关功能
PDF(1798KB) Free
打印本文
把本文推荐给朋友
作者相关文章
马云红  在本刊中的所有文章
王成汗  在本刊中的所有文章
江腾蛟  在本刊中的所有文章
张堃  在本刊中的所有文章

参考文献:
[1] Zhang Z, Zhang J, Xue H. Improved K-Means Clustering Algorithm[C]//Image and Signal Processing CISP'08 Congress on IEEE, 2008, 5:169-172
[2] Wu J, Cui Z M, Shi Y J, Gong S R. Local Density-Based Similarity Matrix Construction for Spectral Clustering[J]. Journal of China Institute of Communications, 2013, 34(3):14-22
[3] 冯少荣, 肖文俊. DBSCAN聚类算法的研究与改进[J]. 中国矿业大学学报,2008, 37(1):105-110 Feng Shaorong, Xiao Wenjun. An Improved DBSCAN Clustering Algorithm[J]. Journal China University of Mining and Technology, 2008, 37(1):105-110(in Chinese)
[4] Rodriguez A, Laio A. Clustering by Fast Search and Find of Density Peaks[J]. Science, 2014, 344(6191):1492-1496