模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2007, Vol. 20 Issue (4): 512-518    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
N个最频繁项集挖掘算法*
陈晓云1,胡运发2
1.福州大学 数学与计算机科学学院 福州 350002
2.复旦大学 计算机与信息技术系 上海 200433
Mining Algorithms of NMost Frequent Itemsets
CHEN XiaoYun1, HU YunFa2
1.School of Mathematics and Computer Science, Fuzhou University, Fuzhou 350002
2.Department of Computer and Information Technology, Fudan University, Shanghai 200433

全文: PDF (457 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 频繁项集挖掘算法的计算复杂性和生成的频繁项集数量随着事务集项数的增加呈指数增长,最小支持度阈值成为控制这种增长的关键.然而,实际应用中仅使用支持度阈值难以有效控制频繁项集的规模.为此定义N个最频繁项集挖掘问题,并提出基于支持度阈值动态调整策略的宽度优先搜索算法NApriori和深度优先搜索算法IntvMatrix挖掘N个最频繁项集.实验表明,本文的2种方法的效率比朴素方法高2倍以上,特别当N值较低时,本文方法的效率优势更为明显.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈晓云
胡运发
关键词 数据挖掘N个最频繁项集支持度阈值倒排矩阵    
Abstract:The computing complexity of the frequent itemsets mining algorithm and the number of frequent itemsets are increased exponentially with the number of items in a transaction set. The minimum support threshold becomes a key to control such an increase. However, in practical application it will be difficult to control frequent itemsets scale, if only support threshold is used. The problem of Nmost frequent itemsets is introduced, and the breadthfirstsearch algorithm NApriori and the depthfirstsearch algorithm IntvMatrix based on the dynamic minimum support threshold are presented to solve the problem. Experimental result shows the proposed algorithms are faster than nave method, and the improvement of the speed is remarkable when N is low.
Key wordsData Mining    NMost Frequent Itemsets    Support Threshold    Inverted Matrix   
收稿日期: 2005-11-22     
ZTFLH: TP311  
基金资助:国家自然科学基金(No. 60473070)、福建省自然科学基金(No.S0650013)资助项目
作者简介: 陈晓云,女,1970年生,副教授,主要研究方向为数据挖掘、机器学习、信息检索.Email:c_xiaoyun@21cn.com.胡运发,男,1940年生,教授,博士生导师,主要研究方向为数据与知识工程.
引用本文:   
陈晓云,胡运发. N个最频繁项集挖掘算法*[J]. 模式识别与人工智能, 2007, 20(4): 512-518. CHEN XiaoYun , HU YunFa. Mining Algorithms of NMost Frequent Itemsets. , 2007, 20(4): 512-518.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2007/V20/I4/512
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn