基于共享邻近度和概率分配的密度峰值聚类算法OA北大核心CSTPCD

中文摘要

针对密度峰值聚类(DPC)算法难以准确找到流形数据的类簇中心以及剩余样本点分配过程易发生连带错误等问题,提出了一种基于共享邻近度和概率分配的密度峰值聚类(SP-DPC)算法。基于K近邻和共享K近邻定义了样本点间的共享邻近度,使用共享邻近度重新定义了样本点的局部密度,从而找到正确的类簇中心;利用样本点的K近邻信息,提出传递概率分配策略和证据概率分配策略共同优化剩余样本点的分配,从而避免分配连带错误;在17个合成数据集和12个UCI数据集上进行实验,将SP-DPC算法与DPC算法、SKM-DPC算法、DPC-NN算法、DBSCAN算法、K-means算法进行对比,实验结果表明SP-DPC算法在AMI、ARI、FMI这3个评价指标上整体取得了相对最优值,聚类效果优于其他对比算法。

作者：朱鸿祥;吴根秀;王兆辉;

作者单位：江西师范大学数学与统计学院,南昌330022

分类：计算机与自动化

中文关键词：密度峰值聚类;K近邻;共享邻近度;概率分配;证据理论

刊名：《计算机工程与应用》 2024 (012)

页码/页数：P.74-90 / 17

基金：国家自然科学基金(62266023)。

DOI：10.3778/j.issn.1002-8331.2305-0502

下载量：0

点击量：0

基于共享邻近度和概率分配的密度峰值聚类算法OA北大核心CSTPCD

评论