模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2012, Vol. 25 Issue (2): 220-224    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
一种基于MapReduce的频繁闭项集挖掘算法
陈光鹏,杨育彬,高阳,商琳
南京大学计算机软件新技术国家重点实验室南京210093
Closed Frequent Itemset Mining Based on MapReduce
CHEN Guang-Peng, YANG Yu-Bin, GAO Yang, SHANG Lin
State Key Laboratory for Novel Software Technology,Nanjing University,Nanjing 210093

全文: PDF (356 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 频繁闭项集的挖掘是发现数据项之间关联规则的一种有效方式。当前以MapReduce模式为基础的云计算平台为解决海量数据中的关联规则挖掘问题提供新的解决思路。文中提出并实现一种基于Hadoop云计算平台的频繁闭项集的并行挖掘算法。该算法主要包括并行计数、构造全局频繁项表、并行挖掘局部频繁闭项集和并行筛选全局频繁闭项集四个步骤。在多个数据集上的实验表明,该方法能较大提高数据挖掘的效率,具有较好的加速比。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈光鹏
杨育彬
高阳
商琳
关键词 云计算并行算法数据挖掘频繁闭项集MapReduce    
Abstract:Closed frequent itemset mining is an useful way for discovering association rules from data. Cloud computing infrastructure based on MapReduce provides a promising solution to address the problem. A parallel algorithm for mining closed frequent itemset is presented based on the Hadoop cloud computing platform. The method consists of four steps: parallel counting, global F-List constructing, parallel mining of local closed frequent itemset and parallel filtrating of global closed frequent itemset. The experimental results validate the method and show that it is effective with a satisfied speedup.
Key wordsCloud Computing    Parallel Algorithm    Data Mining    Closed Frequent Itemset    MapReduc   
收稿日期: 2011-02-14     
ZTFLH: TP311  
基金资助:国家自然科学基金项目(No.61035003,60875011,60721002)、国家973计划项目(No.2010CB327903)、科技部国际科技合作计划项目(No.2010DFA11030)和江苏省自然科学基金项目(No.BK2010054)资助
作者简介: 陈光鹏,男,1985年生,硕士研究生,主要研究方向为数据挖掘。杨育彬,男,1977年生,博士,副教授,主要研究方向为数据挖掘、机器学习。E-mail:yangyubin@nju。edu。cn。高阳,男,1972年生,教授,博士生导师,主要研究方向为数据挖掘、机器学习。商琳,女,1973年生,博士,副教授,主要研究方向为数据挖掘、机器学习。
引用本文:   
陈光鹏,杨育彬,高阳,商琳. 一种基于MapReduce的频繁闭项集挖掘算法[J]. 模式识别与人工智能, 2012, 25(2): 220-224. CHEN Guang-Peng, YANG Yu-Bin, GAO Yang, SHANG Lin. Closed Frequent Itemset Mining Based on MapReduce. , 2012, 25(2): 220-224.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2012/V25/I2/220
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn