留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于前缀树的数据流容错概要结构构造

由育阳 张健沛 杨志宏 由勇

由育阳, 张健沛, 杨志宏, 等 . 基于前缀树的数据流容错概要结构构造[J]. 北京航空航天大学学报, 2011, 37(5): 564-568.
引用本文: 由育阳, 张健沛, 杨志宏, 等 . 基于前缀树的数据流容错概要结构构造[J]. 北京航空航天大学学报, 2011, 37(5): 564-568.
You Yuyang, Zhang Jianpei, Yang Zhihong, et al. Construction of fault-tolerant synopsis over data stream based on prefix-tree[J]. Journal of Beijing University of Aeronautics and Astronautics, 2011, 37(5): 564-568. (in Chinese)
Citation: You Yuyang, Zhang Jianpei, Yang Zhihong, et al. Construction of fault-tolerant synopsis over data stream based on prefix-tree[J]. Journal of Beijing University of Aeronautics and Astronautics, 2011, 37(5): 564-568. (in Chinese)

基于前缀树的数据流容错概要结构构造

基金项目: 国家自然科学基金资助项目(61073041)
详细信息
    作者简介:

    由育阳(1977-),男,黑龙江哈尔滨人,博士生,arthurwy@163.com.

  • 中图分类号: TP 311.13

Construction of fault-tolerant synopsis over data stream based on prefix-tree

  • 摘要: 应用于数据流环境的数据挖掘算法应首要考虑算法的时空复杂性,而要实现消耗巨大计算资源的容错模式挖掘则更要专注于算法的效率.容错模式挖掘是为了从被噪声干扰的真实世界数据中获取允许一定程度错配的、更加泛化的有用知识.提出一种新的单遍历、高压缩的容错前缀树形概要结构DSFT-tree(Data Stream Fault-Tolerant Frequent Pattern Tree),用来捕捉最近到达的数据流中的数据元素,并且能够高效移除过期数据,实现最大限度地降低计算资源消耗.利用滑动窗指针和位向量表达法实现容错树形概要结构的高效重构,并进一步基于滑动窗口技术实现了数据流环境下的容错频繁项挖掘.实验采用IBM数据发生器产生事务数据,在合理时间内最终挖掘频繁项的数量为FP-stream算法的1.5倍.

     

  • [1] Beringer J,Hullermeier E.Online clustering of parallel data streams[J].Data & Knowledge Engineering,2006,58(2):180- 204 [2] Li H F,Lee S Y.Mining frequent itemsets over data streams using efficient window sliding techniques [J].Expert Systems with Applications,2009,36(2):1466-1477 [3] Chang J H,Lee W S.Online data stream mining of recent frequent itemsets by sliding window method[J].Journal of Information Science,2005,31(2):76-90 [4] Yu J X,Chong Z H,Lu H J,et al.A false negative approach to mining frequent itemsets from high speed transactional data streams[J].Information Sciences,2006,176 (14):1986-2015 [5] Yang C,Fayyad U,Bradley P S.Efficient discovery of error-tolerant frequent itemsets in high dimensions //Proc of 2001 ACM Int Conf on Knowledge Discovery in Databases.San Francisco,CA:Association for Computing Machinery,2001:194-203 [6] Bashir S, Halim Z,Baig A R.Mining fault tolerant frequent patterns using pattern growth approach //AICCSA 08-6th IEEE/ACS International Conference on Computer Systems and Applications.Doha,Qatar:Inst of Elec and Elec Eng Computer Society,2008:172-179 [7] Zhang S C,Zhang J L,Zhang C Q.EDUA:an efficient algorithm for dynamic database mining[J].Information Sciences,2007,177(13):2756-2767 [8] Chi Y,Wang H,Yu P S,et al.Catch the moment:maintaining closed frequent itemsets over a data stream sliding window[J].Knowledge and Information Systems,2006,10(3):265-294
  • 加载中
计量
  • 文章访问数:  2567
  • HTML全文浏览量:  42
  • PDF下载量:  867
  • 被引次数: 0
出版历程
  • 收稿日期:  2010-11-02
  • 网络出版日期:  2011-05-30

目录

    /

    返回文章
    返回
    常见问答