基于GraphLab的分布式近邻传播聚类算法

Journal of Shandong University(Engineering Science)(2013)

引用 0|浏览8
暂无评分
摘要
为有效实现海量数据的非线性聚类,提出基于GraphLab的分布式流式近邻传播算法——GStrAP(GraphLab based stream affinity propagation)。该算法将数据抽象为有向无环图模型,采用"Gather-Apply-Scatter"的模式完成数据同步和算法迭代。在人工合成流形数据3D Clusters、Aggregation、Flame和Pathbased数据集上分别采用不同数据规模以及与传统K-means的聚类性能做对比,实验表明:基于GraphLab的近邻传播算法对数据规模具有良好的拓展性,在保持算法聚类效果的同时,有效降低时间复杂度。
更多
查看译文
关键词
distributed computation,GraphLab,affinity propagation clustering algorithm,clustering ensemble
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要