模式识别与人工智能
2025年4月13日 星期日   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2022, Vol. 35 Issue (5): 422-438    DOI: 10.16451/j.cnki.issn1003-6059.202205004
综述与评论 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于马尔科夫边界发现的因果特征选择算法综述
吴兴宇1, 江兵兵2, 吕胜飞3, 王翔宇1, 陈秋菊4, 陈欢欢1
1.中国科学技术大学 计算机科学与技术学院 合肥 230027;
2.杭州师范大学 信息科学与工程学院 杭州 311121;
3.南洋理工大学 计算机科学与工程学院 新加坡 639798 新加坡;
4.中国科学技术大学 信息科学技术学院 合肥 230026
A Survey on Causal Feature Selection Based on Markov Boundary Discovery
WU Xingyu1, JIANG Bingbing2, LÜ Shengfei3, WANG Xiangyu1, CHEN Qiuju4, CHEN Huanhuan1
1. School of Computer Science and Technology, University of Science and Technology of China, Hefei 230027;
2. School of Information Science and Technology, Hangzhou Normal University, Hangzhou 311121;
3. School of Computer Science and Engineering, Nanyang Technological University, Singapore 639798 Singapore;
4. School of Information Science and Technology, University of Science and Technology of China, Hefei 230026

全文: PDF (1128 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 因果特征选择算法(也称为马尔科夫边界发现)学习目标变量的马尔科夫边界,选择与目标存在因果关系的特征,具有比传统方法更好的可解释性和鲁棒性.文中对现有因果特征选择算法进行全面综述,分为单重马尔科夫边界发现算法和多重马尔科夫边界发现算法.基于每类算法的发展历程,详细介绍每类的经典算法和研究进展,对比它们在准确性、效率、数据依赖性等方面的优劣.此外,进一步总结因果特征选择在特殊数据(半监督数据、多标签数据、多源数据、流数据等)中的改进和应用.最后,分析该领域的当前研究热点和未来发展趋势,并建立因果特征选择资料库(http://home.ustc.edu.cn/~xingyuwu/MB.html),汇总该领域常用的算法包和数据集.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 马尔科夫边界特征选择因果学习因果特征选择贝叶斯网络马尔科夫毯    
Abstract:Causal feature selection methods,also known as Markov boundary discovery methods, select features by learning the Markov boundary(MB) of the target variable. Hence, causal feature selection methods possess better interpretability and robustness than the traditional methods. In this paper, the existing causal feature selection methods are reviewed comprehensively. The methods are divided into two types, single MB discovery algorithms and multiple MB discovery algorithms. Based on the development history of each type, the typical algorithms as well as the recent advances are introduced in detail, and the accuracy, efficiency and data dependency of the algorithms are compared. Moreover, the extended MB discovery algorithms for special applications, including semi supervised learning, multi-label learning, multi-source learning and streaming data learning, are summarized. Finally, the current hotspots and the research directions in the future of causal feature selection are analyzed. Additionally, a toolbox for causal feature selection is developed(http://home.ustc.edu.cn/~xingyuwu/MB.html), where the commonly used packages and datasets are provided.
Key wordsMarkov Boundary    Feature Selection    Causal Learning    Causal Feature Selection    Bayesian Network    Markov Blanket   
收稿日期: 2021-12-20     
ZTFLH: TP391  
基金资助:国家科技创新2030——“新一代人工智能”重大项目(No.2021ZD0111700)、国家自然科学基金项目(No.62137002,62006065)、安徽省重点研发计划项目(No.202104a05020011)、安徽省科技重大专项项目(No.202103a07020002)、中央高校基本科研业务费专项资金(No.WK2150110019,WK2100000027)资助
通讯作者: 陈欢欢,博士,教授,主要研究方向为神经网络、贝叶斯推断、演化计算.E-mail:hchen@ustc.edu.cn.   
作者简介: 吴兴宇,博士研究生,主要研究方向为因果学习、特征选择、机器学习.E-mail:xingyuwu@mail.ustc.edu.cn.
江兵兵,博士,讲师,主要研究方向为贝叶斯学习、半监督学习.E-mail:jiangbb@hznu.edu.cn.
吕胜飞,博士,主要研究方向为关系抽取.E-mail:shengfei.lyu@ntu.edu.sg.
王翔宇,博士研究生,主要研究方向为知识图谱.E-mail:sa312@mail.ustc.edu.cn.
陈秋菊,博士,副研究员,主要研究方向为信号与信息处理(电子对抗信息处理)、知识融合的智能计算.E-mail:qqchern@ustc.edu.cn.
引用本文:   
吴兴宇, 江兵兵, 吕胜飞, 王翔宇, 陈秋菊, 陈欢欢. 基于马尔科夫边界发现的因果特征选择算法综述[J]. 模式识别与人工智能, 2022, 35(5): 422-438. WU Xingyu, JIANG Bingbing, LÜ Shengfei, WANG Xiangyu, CHEN Qiuju, CHEN Huanhuan. A Survey on Causal Feature Selection Based on Markov Boundary Discovery. Pattern Recognition and Artificial Intelligence, 2022, 35(5): 422-438.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202205004      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2022/V35/I5/422
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn