模式识别与人工智能
2025年8月11日 星期一   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2024, Vol. 37 Issue (11): 1010-1021    DOI: 10.16451/j.cnki.issn1003-6059.202411006
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于扩散模型的无条件反事实解释生成方法
仲智1, 王宇2, 祝子烨1, 李云1
1.南京邮电大学 计算机学院 南京 210023;
2.中国药科大学 理学院 南京 211198
Diffusion Models Based Unconditional Counterfactual Explanations Generation
ZHONG Zhi1, WANG Yu2, ZHU Ziye1, LI Yun1
1. School of Computer Science, Nanjing University of Posts and Telecommunications, Nanjing 210023;
2. School of Science, China Pharmaceutical University, Nanjing 211198

全文: PDF (4222 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 反事实解释通过对输入数据实施最小且具解释性的改动改变模型输出,揭示影响模型决策的关键因素.现有基于扩散模型的反事实解释方法依赖条件生成,需要额外获取与分类相关的语义信息,难以保证语义信息质量并增加计算成本.针对上述问题,文中基于生成扩散模型中的DDIMs(Denoising Diffusion Implicit Models),提出基于扩散模型的无条件反事实解释生成方法.首先,利用隐式去噪扩散模型在反向去噪过程中展现的一致性,将噪声图像视为隐变量以控制输出生成,从而使扩散模型适用于无条件的反事实解释生成流程.然后,充分利用隐式去噪扩散模型在过滤高频噪声和分布外扰动方面的优势,重塑无条件的反事实解释生成流程,生成具有解释性的语义改动.在不同数据集上的实验表明,文中方法的多项指标值较优.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
仲智
王宇
祝子烨
李云
关键词 深度学习可解释性反事实解释扩散模型对抗攻击    
Abstract:Counterfactual explanations alter the model output by implementing minimal and interpretable modifications to input data, revealing key factors influencing model decisions. Existing counterfactual explanation methods based on diffusion models rely on conditional generation, requiring additional semantic information related to classification. However, ensuring semantic quality of the semantic information is challenging and computational costs are increased. To address these issues, an unconditional counterfactual explanation generation method based on the denoising diffusion implicit model(DDIM)is proposed. By leveraging the consistency exhibited by DDIM during the reverse denoising process, noisy images are treated as latent variables to control the generated outputs, thus making the diffusion model suitable for unconditional counterfactual explanation generation workflows. Then, the advantages of DDIM in filtering high-frequency noise and out-of-distribution perturbations are fully utilized, thereby reconstructing the unconditional counterfactual explanation workflow to generate semantically interpretable modifications. Extensive experiments on different datasets demonstrate that the proposed method achieves superior results across multiple metrics.
Key wordsDeep Learning    Interpretability    Counterfactual Explanation    Diffusion Model    Adversarial Attack   
收稿日期: 2024-09-12     
ZTFLH: TP 391  
基金资助:国家自然科学基金项目(No.61772284,62406148,62306339)、江苏省自然科学基金项目(No.SBK2024047556)资助
通讯作者: 李 云,博士,教授,主要研究方向为可信人工智能.E-mail:liyun@njupt.edu.cn.   
作者简介: 仲 智,硕士研究生,主要研究方向为机器学习.E-mail:1022040906@njupt.edu.cn.王 宇,博士,讲师,主要研究方向为机器学习、自然语言处理.E-mail:wangyu@cpu.edu.cn. 祝子烨,博士,讲师,主要研究方向为机器学习、自然语言处理.E-mail:zhuziye@njupt.edu.cn.
引用本文:   
仲智, 王宇, 祝子烨, 李云. 基于扩散模型的无条件反事实解释生成方法[J]. 模式识别与人工智能, 2024, 37(11): 1010-1021. ZHONG Zhi, WANG Yu, ZHU Ziye, LI Yun. Diffusion Models Based Unconditional Counterfactual Explanations Generation. Pattern Recognition and Artificial Intelligence, 2024, 37(11): 1010-1021.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202411006      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I11/1010
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn