模式识别与人工智能
2025年5月1日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2010, Vol. 23 Issue (5): 616-623    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于脉冲余弦变换的选择性视觉注意模型
余映1,王斌1,2张立明1
1.复旦大学 信息科学与工程学院 电子工程系 上海 200433
2.复旦大学 波散射和遥感信息教育部重点实验室 上海 200433
Selective Visual Attention Model Based on Pulsed Cosine Transform
YU Ying1,WANG Bin1,2,ZHANG Li-Ming1
1.Department of Electronic Engineering,School of Information Science and Engineering,Fudan University,Shanghai 200433
2.Key Laboratory of Wave Scattering and Remote Sensing Information Ministry of Education,Fudan University,Shanghai 200433

全文: PDF (583 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 提出一种基于脉冲余弦变换的视觉注意模型,它模仿自底向上视觉注意的形成机制。该模型结构简单,计算速度快,能够应用于实时处理系统。在该模型中,视觉显著性可表示为二元编码,这与人脑神经元脉冲放电方式相符合。运动显著性也可通过这些二元编码生成。此外,该模型还可推广为基于Hebb学习规则的神经网络。实验结果表明,在人眼注视点预测性能上,该模型优于其它经典视觉注意模型。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
余映1
王斌1
2张立明1
关键词 视觉注意显著图运动视觉脉冲余弦变换(PCT)主成分分析    
Abstract:A visual attention model based on pulsed cosine transform is proposed, which mimics the generating mechanism of bottom-up visual attention. Due to its simple architecture and high computational speed, the proposed model can be used in real-time systems. The visual salience of the model is represented in binary codes, which agrees with the firing pattern of neurons in the human brain. The motion salience is generated by these binary codes as well. Moreover, the model can be extended to Hebbian-based neural networks. Experimental results show that the proposed model has better performance in human fixation prediction than other state-of-the-art models of visual attention.
Key wordsVisual Attention    Saliency Map    Motion Vision    Pulsed Cosine Transform (PCT)    Principal Component Analysis   
收稿日期: 2009-03-09     
ZTFLH: TP181  
  TP183  
  TP391  
基金资助:国家863计划项目(No.2009AA12Z115)、国家自然科学基金项目(No.61071134)和上海市重点学科建设项目(No.B112)资助
作者简介: 余映,男,1977年生,博士研究生,主要研究方向为计算机视觉、人工神经网络.E-mail:yuying.mail@163.com.王斌,男,1964年生,教授,主要研究方向为信号和图像处理.张立明,女,1943年生,教授,主要研究方向为人工神经网络、图像处理和识别.
引用本文:   
余映,王斌张立明. 基于脉冲余弦变换的选择性视觉注意模型[J]. 模式识别与人工智能, 2010, 23(5): 616-623. YU Ying,WANG Bin,ZHANG Li-Ming. Selective Visual Attention Model Based on Pulsed Cosine Transform. , 2010, 23(5): 616-623.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2010/V23/I5/616
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn