模式识别与人工智能
2025年3月14日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2020, Vol. 33 Issue (11): 1043-1053    DOI: 10.16451/j.cnki.issn1003-6059.202011009
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于Yes/No反馈的视觉问答方法
邓硙1, 汪剑鸣1,2, 金光浩2
1.天津工业大学 电子与信息工程学院 天津 300387;
2.天津工业大学 计算机科学与技术学院 天津 300387
Visual Question Answering Method Based on Yes/No Feedback
DENG Wei1, WANG Jianming1,2, JIN Guanghao2
1. School of Electronics and Information Engineering,Tiangong University,Tianjin 300387;
2. School of Computer Science and Technology,Tiangong University,Tianjin 300387

全文: PDF (995 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 针对视觉问答任务中问题语句可能存在的歧义,文中提出基于Yes/No反馈的视觉问答方法,通过Yes/No的反馈机制判断模型第一次得出答案的正误.当用户给出的反馈信息为No时,重新解析该问题,生成多种消歧后的问题,产生不同的候选答案,输出最高置信度的答案作为最终结果.在CLEVR、CLEVR-CoGenT基准数据集上的实验表明文中方法精度较高.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
邓硙
汪剑鸣
金光浩
关键词 视觉问答计算机视觉自然语言处理句法消歧反馈    
Abstract:Aiming at the ambiguous question sentence in the visual question answering task,a visual question answering method based on Yes/No feedback is proposed.The Yes/No feedback mechanism is employed to determine whether or not the answer is correct for the first time.When the feedback given by the user is no,the question is re-analyzed,new questions are generated after disambiguation and different candidate answers are generated.The answer with the highest confidence is output as the final result.The experimental results on ClEVR,CLEVR-CoGen benchmark datasets show the proposed method achieves higher accuracy than the existing methods.
Key wordsVisual Question Answering    Computer Vision    Natural Language Processing    Syntactic Disambiguation    Feedback   
收稿日期: 2020-03-18     
ZTFLH: P315.69  
基金资助:国家自然科学基金项目(No.61373104)、天津市高等学校基本科研业务费项目(No.2019KJ019)资助
通讯作者: 金光浩,博士,讲师,主要研究方向为计算机视觉、人工智能、深度学习、异构/重构计算.E-mail:jingh_research@163.com.   
作者简介: 邓硙,硕士研究生,主要研究方向为视觉问答、计算机视觉、自然语言处理.E-mail:dengwei940517@163.com.汪剑鸣,博士,教授,主要研究方向为信号处理、机器学习、智能控制技术.E-mail:wangjianming@tjpu.edu.cn.
引用本文:   
邓硙, 汪剑鸣, 金光浩. 基于Yes/No反馈的视觉问答方法[J]. 模式识别与人工智能, 2020, 33(11): 1043-1053. DENG Wei, WANG Jianming, JIN Guanghao. Visual Question Answering Method Based on Yes/No Feedback. , 2020, 33(11): 1043-1053.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202011009      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2020/V33/I11/1043
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn