一种改进的模糊连接点聚类算法
【出 处】:
【作 者】:
孙明珊
覃华
苏一丹
【摘 要】传统的模糊连接点FJP聚类算法采用基于欧氏距离的最大-最小合成运算法生成传递闭包,该方法所生成的传递闭包存在失真问题,即包含有较多错误的数据关联信息,最终造成算法聚类精度低且计算时间长.针对以上问题,提出一种改进的模糊连接点聚类算法:先用组合核函数计算数据集的模糊相似度矩阵,提高算法对数据非线性特征的辨识能力,并用大顶堆存储之;然后遍历传递闭包矩阵中的空元素,用堆顶的桥元素填充传递闭包的空元素,直至生成传递闭包.在测试数据集上的实验结果表明,本文算法的平均聚类精度较传统FJP算法有20%以上的提升,显著改善了传递闭包的失真问题;另外,在大型数据集上的计算效率亦优于传统FJP算法的,说明本文改进FJP算法的思路是有效的、可行的.
相关热词搜索: 模糊连接点聚类算法 传递闭包 桥元素 大项堆
上一篇:第一页
下一篇: 基于弹幕情感分析和聚类算法的视频用户群体分类