模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2024, Vol. 37 Issue (7): 638-651    DOI: 10.16451/j.cnki.issn1003-6059.202407006
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
解耦表征学习视角下认知图像属性特征的图像生成方法
蔡江海1,2, 黄成泉1,2,3, 王顺霞2, 罗森艳2, 杨贵燕2, 周丽华2
1.贵州民族大学 贵州省模式识别与智能系统重点实验室 贵阳 550025;
2.贵州民族大学 数据科学与信息工程学院 贵阳 550025;
3.贵州民族大学 工程技术人才实践训练中心 贵阳 550025
Image Generation Method for Cognizing Image Attribute Features from the Perspective of Disentangled Representation Learning
CAI Jianghai1,2, HUANG Chengquan1,2,3, WANG Shunxia2, LUO Senyan2, YANG Guiyan2, ZHOU Lihua2
1. Key Laboratory of Pattern Recognition and Intelligent Systems of Guizhou Province, Guizhou Minzu University, Guiyang 550025;
2. School of Data Sciences and Information Engineering, Guizhou Minzu University, Guiyang 550025;
3. Engineering Training Center, Guizhou Minzu University, Gui-yang 550025

全文: PDF (4136 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 在生成式人工智能领域,解耦表征学习的研究进一步推动图像生成方法的发展,但现有的解耦方法更多地关注图像生成的低维表示,忽略目标变化图像内在的可解释因素,导致生成的图像容易受到其它不相关属性特征的影响.为此,文中提出解耦表征学习视角下认知图像属性特征的图像生成方法.首先,从生成模型的潜在空间出发,通过训练获得关于目标变化图像的候选遍历方向.然后,构建无监督语义分解策略,并基于候选遍历的方向联合发现嵌入在潜在空间中的可解释方向.最后,利用解耦编码器和对比学习构建对比模拟器和变化空间,进而由可解释方向提取目标变化图像的解耦表征并生成图像.在5个解耦数据集上的实验表明文中方法性能较优.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
蔡江海
黄成泉
王顺霞
罗森艳
杨贵燕
周丽华
关键词 解耦表征学习潜在空间可解释方向图像生成变化空间    
Abstract:In the field of generative artificial intelligence, the research of disentangled representation learning further promotes the development of image generation methods. However, existing disentanglement methods pay more attention to low-dimensional representation of image generation, ignoring inherent interpretable factors of the target variation image. This oversight results in generated image being susceptible to the influence of other irrelevant attribute features. To address this issue, an image generation method for cognizing image attribute features from the perspective of disentangled representation learning is proposed. Firstly, candidate traversal directions for the target variation image are obtained by training, starting from the latent space of the generative model. Secondly, an unsupervised semantic decomposition strategy is constructed, and the interpretable directions embedded in the latent space are jointly discovered based on the direction of candidate traversals. Finally, a contrast simulator and a variation space are constructed using disentangled encoders and contrastive learning. Consequently, the disentangled representations of the target variation image are extracted from the interpretable directions and the image is generated. Extensive experiments on five popular disentanglement datasets demonstrate the superior performance of the proposed method.
Key wordsDisentangled Representation Learning    Latent Space    Interpretable Direction    Image Ge-neration    Variation Space   
收稿日期: 2024-04-26     
ZTFLH: TP391  
基金资助:国家自然科学基金项目(No.62062024)、贵州省科技计划项目(No.黔科合基础-ZK[2021]一般342)、贵州省研究生教育教学改革重点项目(No.黔教合YJSJGKT [2021]018)、贵州省教育厅自然科学研究项目(No.黔教技[2022]015)、贵州省模式识别与智能系统重点实验室2022年度开放课题(No.GZMUKL[2022]KF03)资助
通讯作者: 黄成泉,博士,教授,主要研究方向为深度学习、图像处理.E-mail:hcq@gzmu.edu.cn.   
作者简介: 蔡江海,硕士研究生,主要研究方向为深度学习、图像处理、解耦表征学习.E-mail:870152989@qq.com.王顺霞,硕士研究生,主要研究方向为机器学习、模式识别.E-mail:2689826749@qq.com.罗森艳,硕士研究生,主要研究方向为机器学习、模式识别.E-mail:1563770769@qq.com.杨贵燕,硕士研究生,主要研究方向为机器学习、模式识别.E-mail:2393350042@qq.com.周丽华,硕士,副教授,主要研究方向为深度学习、图像处理.E-mail:zlh@gzmu.edu.cn.
引用本文:   
蔡江海, 黄成泉, 王顺霞, 罗森艳, 杨贵燕, 周丽华. 解耦表征学习视角下认知图像属性特征的图像生成方法[J]. 模式识别与人工智能, 2024, 37(7): 638-651. CAI Jianghai, HUANG Chengquan, WANG Shunxia, LUO Senyan, YANG Guiyan, ZHOU Lihua. Image Generation Method for Cognizing Image Attribute Features from the Perspective of Disentangled Representation Learning. Pattern Recognition and Artificial Intelligence, 2024, 37(7): 638-651.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202407006      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2024/V37/I7/638
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn