模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2022, Vol. 35 Issue (10): 939-951    DOI: 10.16451/j.cnki.issn1003-6059.202210007
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于属性树的并行化增量式动态属性约简算法
秦廷桢1, 丁卫平1, 鞠恒荣1, 李铭1, 黄嘉爽1, 陈悦鹏1, 王海鹏1
1.南通大学 信息科学技术学院 南通 226019
Parallel Incremental Dynamic Attribute Reduction Algorithm Based on Attribute Tree
QIN Tingzhen1, DING Weiping1, JU Hengrong1, LI Ming1, HUANG Jiashuang1, CHEN Yuepeng1, WANG Haipeng1
1. School of Information Science and Technology, Nantong University, Nantong 226019

全文: PDF (1104 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 传统增量算法主要侧重于从更新近似的角度进行属性约简,但在处理大规模数据集时需要评估所有属性并反复计算重要度,提升时间复杂度,降低效率.针对上述问题,文中提出基于属性树的并行化增量加速策略,关键步骤是将所有属性聚类成多棵属性树进行并行化动态属性评估.首先,根据属性树相关性度量选择合适的属性树进行属性评估,降低时间复杂度.再增加分支系数至停止准则中,随着分支深度的增加进行动态增加,可使算法在达到最大阈值后自主跳出循环,有效避免原先的冗余计算,提高效率.基于上述策略,提出基于属性树的增量属性约简算法,同时与Spark并行机制结合,设计基于属性树的并行化增量式动态属性约简算法.在多个数据集上的广泛实验表明,文中算法在保持分类性能的同时,可提高动态变化数据集约简的搜索效率,具有较好的性能优势.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
秦廷桢
丁卫平
鞠恒荣
李铭
黄嘉爽
陈悦鹏
王海鹏
关键词 属性约简属性树知识粒度并行计算增量学习Spark框架    
Abstract:Traditional incremental methods mainly focus on the attribute reduction from the perspective of updating approximation. However, while processing large-scale data sets, the methods need to evaluate all attributes and calculate importance repeatedly. Thus, time complexity is increased and efficiency is decreased. To solve the problems, an incremental acceleration strategy for parallelization based on attribute tree is proposed. The key step is to cluster all attributes into multiple attribute trees for parallel dynamic attribute evaluation. Firstly, an appropriate attribute tree is selected for attribute evaluation according to the attribute tree correlation measure to reduce the time complexity. Then, the branch coefficient is added to the stop criterion, and the dynamic increase is conducted with the increase of the branch depth. Consequently, the algorithm can jump out of the cycle automatically after reaching the maximum threshold to avoid the original redundant calculation and improve the efficiency effectively. Based on the above improvements, an incremental dynamic attribute reduction algorithm based on attribute tree is proposed, and a parallel incremental dynamic attribute reduction algorithm based on attribute tree is designed by being combined with Spark parallel mechanism. Finally, experiments on multiple datasets show that the proposed algorithm improves the search efficiency of dynamically variational dataset reduction significantly while maintaining the classification performance, holding a better performance advantage.
Key wordsAttribute Reduction    Attribute Tree    Knowledge Granularity    Parallel Computing    Incremental Learning    Spark Framework   
收稿日期: 2022-09-19     
ZTFLH: TP 18  
基金资助:国家自然科学基金项目(No.61976120,62006128,62102199)、江苏省自然科学基金项目(No.BK20191445)、江苏省双创博士计划(No.(2020)30986)、江苏省高等学校自然科学研究重大项目(No.21KJA510004)、江苏省高等学校自然科学研究面上项目(No.20KJB520009)、南通市科技局基础科学研究项目(No.JC2020141,JC2021122)、中国博士后科学基金项目(No.2022M711716)、教育部人文社会科学研究青年基金项目(No.21YJCZH013)、江苏省研究生科研与实践创新计划(No.SJCX21_1446)资助
通讯作者: 丁卫平,博士,教授,主要研究方向为数据挖掘、机器学习、粒计算、演化计算、大数据分析等.E-mail:dwp9988@163.com.   
作者简介: 秦廷桢,硕士研究生,主要研究方向为数据挖掘、粒计算、粗糙集.E-mail:qtz517469152@163.com. 鞠恒荣,博士,副教授,主要研究方向为粒计算、粗糙集、机器学习、知识发现.E-mail:juhengrong@ntu.edu.cn. 李 铭,硕士,主要研究方向为数据挖掘、粒度计算、大数据分析.E-mail:1930310041@stmail.ntu.edu.cn. 黄嘉爽,博士,副教授,主要研究方向为脑网络分析、深度学习.E-mail:hjshdym@163.com. 陈悦鹏,博士研究生,主要研究方向为粒计算、粗糙集、机器学习.E-mail:15850623872@163.com. 王海鹏,硕士研究生,主要研究方向为模糊理论、粒度计算、深度学习.E-mail:1781053215@qq.com.
引用本文:   
秦廷桢, 丁卫平, 鞠恒荣, 李铭, 黄嘉爽, 陈悦鹏, 王海鹏. 基于属性树的并行化增量式动态属性约简算法[J]. 模式识别与人工智能, 2022, 35(10): 939-951. QIN Tingzhen, DING Weiping, JU Hengrong, LI Ming, HUANG Jiashuang, CHEN Yuepeng, WANG Haipeng. Parallel Incremental Dynamic Attribute Reduction Algorithm Based on Attribute Tree. Pattern Recognition and Artificial Intelligence, 2022, 35(10): 939-951.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202210007      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2022/V35/I10/939
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn