留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

具有容错特性的两层数据流聚类方法

由育阳 朱纪洪 杨志宏

由育阳, 朱纪洪, 杨志宏等 . 具有容错特性的两层数据流聚类方法[J]. 北京航空航天大学学报, 2012, 38(5): 665-669,674.
引用本文: 由育阳, 朱纪洪, 杨志宏等 . 具有容错特性的两层数据流聚类方法[J]. 北京航空航天大学学报, 2012, 38(5): 665-669,674.
You Yuyang, Zhu Jihong, Yang Zhihonget al. Two-layer clustering over data stream with fault-tolerance[J]. Journal of Beijing University of Aeronautics and Astronautics, 2012, 38(5): 665-669,674. (in Chinese)
Citation: You Yuyang, Zhu Jihong, Yang Zhihonget al. Two-layer clustering over data stream with fault-tolerance[J]. Journal of Beijing University of Aeronautics and Astronautics, 2012, 38(5): 665-669,674. (in Chinese)

具有容错特性的两层数据流聚类方法

基金项目: 国家自然科学基金资助项目(81102879)
详细信息
  • 中图分类号: TP 311.13

Two-layer clustering over data stream with fault-tolerance

  • 摘要: 提出一种具有容错能力的进化数据流聚类算法FTGDStream (Fault-Tolerant Grid-Density Clustering over Data Stream),通过在聚类过程中引入适当的松弛条件,从而在含有噪声的真实世界数据中获取更加泛化的有用知识.首先利用基于相似性度量和小波技术的HLSFTS (Hierarchical Lifting Scheme Fault-Tolerant Synopses)层次概要数据结构实现在线微聚类过程,然后采用基于网格密度的聚类算法实现离线宏聚类过程.在线算法所构造的小波概要数据结构对原始数据的高压缩率降低了离线网格密度聚类算法的计算负载,提高了二层数据流聚类算法的效率.在UCI数据集上的仿真实验结果表明,FTGDStream算法可以聚类任意空间形状的数据并且适用于高维数据流环境,是一种具有容错能力的高效数据流聚类算法.

     

  • [1] Callaghan O L,Mishra N,Meyerson A.Streaming data algorithms for high-quality clustering[C]//San Jose.Proceedings of International Conference on Data Engineering.California:IEEE Computer Society,2002:685-699
    [2] Chen Y X,Tu L.Density-based clustering for real-time stream data[C]//San Jose.Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining.California:ACM,2007:133-142[ZK)]
    [3] Aggarwal C C,Han Jiawei,Wang Jianyong,et al.A framework for clustering evolving data streams[C]//Proceeding of the 29th International Conference on Very Large Data Bases.Berlin:Morgan Kaufmann ,2003:81-92
    [4] Aggarwal C C,Han Jiawei,Wang Jianyong,et al.A framework for projected clustering of high dimensional data streams[C]//Proceeding of the 29th International Conference on Very Large Data Bases.Toronto,Canada:Morgan Kaufmann,2004:852-863
    [5] Chen Mingsheng,Wu Xianliang,Wei Sha,et al.Fast multipole method accelerated by lifting wavelet transform scheme[J].Applied Computational Electromagnetics Society Journal,2009,24(2):109-115
    [6] Shahin M,Badawi A,Kamel M.Biometric authentication using fast correlation of near infrared hand vein patterns [J].International Journal of Biometrical Sciences,2007,2 (3):141-148
    [7] Cao Feng,Ester M,Qian Weining,et al.Density-based clustering over an evolving data stream with noise[C]//Proceedings of the 6th SIAM International Conference on Data Mining.Bethesda,MD:SIAM,2006:326-337
    [8] Han J,Kamber M.Data mining:concepts and techniques[M].2nd ed.Morgan Kaufmann:Elsevier Inc,2006:467-589
  • 加载中
计量
  • 文章访问数:  2477
  • HTML全文浏览量:  206
  • PDF下载量:  438
  • 被引次数: 0
出版历程
  • 收稿日期:  2011-02-07
  • 网络出版日期:  2012-05-30

目录

    /

    返回文章
    返回
    常见问答