留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种基于有效修剪的最大频繁项集挖掘算法

陈鹏 吕卫锋

陈鹏, 吕卫锋. 一种基于有效修剪的最大频繁项集挖掘算法[J]. 北京航空航天大学学报, 2006, 32(02): 218-223.
引用本文: 陈鹏, 吕卫锋. 一种基于有效修剪的最大频繁项集挖掘算法[J]. 北京航空航天大学学报, 2006, 32(02): 218-223.
Chen Peng, Lü Weifeng. Maximal frequent itemsets mining algorithm based on effective pruning mechanisms[J]. Journal of Beijing University of Aeronautics and Astronautics, 2006, 32(02): 218-223. (in Chinese)
Citation: Chen Peng, Lü Weifeng. Maximal frequent itemsets mining algorithm based on effective pruning mechanisms[J]. Journal of Beijing University of Aeronautics and Astronautics, 2006, 32(02): 218-223. (in Chinese)

一种基于有效修剪的最大频繁项集挖掘算法

基金项目: 国家重点基础研究发展规划资助项目(G1999032709);国家自然科学基金资助项目(90104008)
详细信息
  • 中图分类号: TP 311

Maximal frequent itemsets mining algorithm based on effective pruning mechanisms

  • 摘要: 对关联挖掘中的最大频繁项集挖掘问题进行了研究,提出了一种基于项集格修剪机制的最大频繁项集挖掘算法.采用项集格生成树的数据结构,将最大频繁项集挖掘过程转化为对项集格生成树进行深度优先搜索获取所有最大频繁节点的过程. 其中提高算法效率的一个重要措施是在遍历项集格生成树的过程中对生成树进行修剪.给出了项集格生成树的三个性质,并在此基础上提出了直接超集修剪、间接超集修剪与事务集等价修剪三种修剪机制,尽可能忽略非频繁节点及其所生成的扩展节点以减少遍历的节点数目.试验结果表明,三种修剪机制都能够有效地减少搜索空间,其中事务集等价修剪机制的效果最好,算法的性能与输入数据集的稠密程度相关.

     

  • [1] Agrawal R, Imielinski, Swami A, et al. Mining association rules between sets of items in large databases . In:Peter Buneman, Sushil Jajodia, eds. Proceedings of the 1993 ACM SIGMOD International Conference on Management of Data . Washington, 1993. 207~216 [2] Agrawal R, Srikant R. Fast algorithms for mining association rules in large database . FJ9839, 1994 [3] Houtsma M, Swami A. Set-oriented mining of association rules . In:Philip S Yu, Arbee L P Chen. eds. Proceedings of the 11th International Conference on Data Engineering . Taipei, 1995. 25~33 [4] Zaki M, Ogihara M. Theoretical foundations of association rules . In:3rd ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery . Washington, 1998. 7.1~7:8 [5] Wille R. Restructuring lattice theory:an approach based on hierarchies of concepts . In:Ivan Rival,ed. Ordered Sets . Reidel, Dordrecht-Boston, 1982. 445~470 [6] Agrawal R, Srikant R. Fast algorithms for mining association rules in large database . In:Jorge B Bocca, Matthias Jarke Carlo Zaniolo, eds. Proceedings of the 20th International Conference on Very Large Data Bases . Santiago,1994. 487~499 [7] Han J, Fu Y. Discovery of multiple-level association rules from large databases . In:Jorge B Bocca, Matthias Jarke, Carlo Zaniolo, eds. Proceedings of 21th International Conference on Very Large Data Bases . Zurich, rland, 1995.39~46 [8] Bayardo R J. Efficiently mining long patterns from databases . In:Proceedings of the 1998 ACM SIGMOD International Conference on Management of Data . Seattle, Washington, 1998. 85~93
  • 加载中
计量
  • 文章访问数:  3107
  • HTML全文浏览量:  154
  • PDF下载量:  1203
  • 被引次数: 0
出版历程
  • 收稿日期:  2005-01-10
  • 网络出版日期:  2006-02-28

目录

    /

    返回文章
    返回
    常见问答