一种划分聚类k值与中心初始化的改进方法

SU Fengrui, MU Weiwei, ZHAO Xuanming,QIU Zhifeng

Computer Engineering(2023)

引用 0|浏览0
暂无评分
摘要
划分聚类方法由于结构清晰、时间效率高而得到广泛的应用,但在缺乏先验知识的实际工业过程中难以合理地进行簇数和中心初值选取,导致聚类处理效果大打折扣.针对利用误差平方和方法获得的肘部点不明显的问题,提出考虑比例主偏差的误差平方和方法(PPD-SSE).在误差平方和的基础上引入主偏差项以加强肘部点附近趋势,同时通过引入比例值避免趋势突变,从而更加准确地进行簇数选择.针对利用k-means++方法选取高维数据初始中心时过于随机的问题,提出轮盘重构的k-means++方法(RWR-kmeans++).利用与已选中心的距离平方,并结合概率下限的方法来重构概率轮盘,提升相异数据被选中的概率,降低初值选取的随机性,提升聚类效果并使之更加稳定.在UEA&UCR公开数据集上的实验结果表明,所提PPD-SSE方法能够有效提升肘部偏折角及簇数预测的准确性,RWR-kmeans++方法能够有效提升初值选取的相异性及聚类效果.
更多
关键词
partition clustering,proportional principal deviation,roulette wheel reconstruction,cluster number selection,initial value selection
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要