模式识别与人工智能
2025年4月11日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2020, Vol. 33 Issue (12): 1083-1096    DOI: 10.16451/j.cnki.issn1003-6059.202012003
“结构化学习表示及其在目标检测与识别中的应用”专题 最新目录| 下期目录| 过刊浏览| 高级检索 |
结合迁移引导和双向循环结构GAN的零样本文本识别
张桂梅1, 龙邦耀1, 鲁飞飞1
1.南昌航空大学 计算机视觉研究所 南昌 330063
Zero-Shot Text Recognition Combining Transfer Guide and Bidirectional Cycle Structure GAN
ZHANG Guimei1, LONG Bangyao1, LU Feifei1
1. Institute of Computer Vision,Nanchang Hangkong University,Nanchang 330063

全文: PDF (2387 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 

为了提高基于生成对抗网络(GAN)的零样本识别方法的识别精度,提出结合迁移引导和双向循环结构GAN的零样本文本识别方法.构造双向循环结构GAN以提高模型的生成能力,生成的伪特征更接近输入的真实特征.引入迁移引导学习的思想,使用迁移后的文本代替可见类文本训练模型,提高不可见类文本的识别精度.增加有效的正则化项,使生成器在训练过程中生成的结果具有多样性,提高生成模型的稳定性.在数据集上的实验表明,文中方法可提高识别精度,具有较好的泛化性能,容易拓广到其它应用中.

服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
张桂梅
龙邦耀
鲁飞飞
关键词 迁移引导双向循环结构零样本学习文本识别    
Abstract

To improve the recognition accuracy of zero-shot recognition methods based on generative adversarial network(GAN),a zero-shot text recognition method combining transfer guidance and bidirectional cycle structure GAN is proposed.Bidirectional cycle structure GAN is constructed to improve the generation ability of the model,thus the generated pseudo features are closer to the real features of the input.The concept of transfer guided learning is introduced,and the model is trained by the transfer text instead of the seen text to improve the recognition accuracy of the unseen text.By adding an effective regularization term,the generator generates diverse results during the training process,and thus the stability of the generated model is improved.The experiment shows that the proposed method improves the accuracy of zero-shot recognition task with high generalization performance and it can be easily extended to other applications.

Key wordsTransfer Guide    Bidirectional Cycle Structure    Zero-Shot Learning    Text Recognition   
收稿日期: 2020-07-22     
基金资助:

国家自然科学基金项目(No.61462065)资助

通讯作者: 张桂梅,博士,教授,主要研究方向为计算机视觉、图像处理、模式识别.E-mail:guimei.zh@163.com.   
作者简介: 龙邦耀,硕士研究生,主要研究方向为计算机视觉、图像处理、模式识别.E-mail:lby609527215@163.com;鲁飞飞,硕士研究生,主要研究方向为计算机视觉、图像处理、模式识别.E-mail:1323568545@qq.com.
引用本文:   
张桂梅, 龙邦耀, 鲁飞飞. 结合迁移引导和双向循环结构GAN的零样本文本识别[J]. 模式识别与人工智能, 2020, 33(12): 1083-1096. ZHANG Guimei, LONG Bangyao, LU Feifei. Zero-Shot Text Recognition Combining Transfer Guide and Bidirectional Cycle Structure GAN. , 2020, 33(12): 1083-1096.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202012003      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2020/V33/I12/1083
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn