模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2013, Vol. 26 Issue (10): 909-915    DOI:
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于多视觉码本的图像表示
宋彦,蒋兵,戴礼荣
中国科学技术大学 电子工程与信息科学系 科大讯飞语音实验室 合肥 230027
Image Representation Based on Multiple Visual Codebooks
SONG Yan, JIANG Bing, DAI Li-Rong
iFlytek Speech Laboratory, Department of Electronic Engineering and Information Science, University of Science and Technology of China, Hefei 230027

全文: PDF (424 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 基于词袋模型的图像表示方法的有效性主要受限于局部特征的量化误差。文中提出一种基于多视觉码本的图像表示方法,通过综合考虑码本构建和编码方法这两个方面的因素加以改进。具体包括:1)多视觉码本构建,以迭代方式构建多个紧凑且具有互补性的视觉码本;2)图像表示,首先针对多码本的情况,依次从各码本中选择相应的视觉单词并采用线性回归估计编码系数,然后结合图像的空间金字塔结构形成最终的图像表示。在一些标准测试集合的图像分类结果验证文中方法的有效性。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
宋彦
蒋兵
戴礼荣
关键词 图像分类视觉码本聚类分析图像表示    
Abstract:The effectiveness of the image representation based on bag-of-visual words(BoW) model is majorly limited by the quantization error. To address this issue, an improved image representation based on multiple visual codebooks is proposed in this paper, which considers both visual codebook construction and feature coding. The proposed method specifically consists of 1) multiple visual codebooks construction, in which the compact and complementary visual codebooks are iteratively generated; 2) image representation, in which the visual words are firstly selected from each individual visual codebook, then the coding coefficients are determined by using the regularized linear regression method, and finally the image is represented by combining the spatial pyramid structure. The experimental results on several benchmark image classification datasets demonstrate the consistent and significant improvement of the proposed method.
Key wordsImage Classification    Visual Codebook    Clustering Analysis    Image Representation   
收稿日期: 2012-08-20     
基金资助:国家自然科学基金资助项目(No.61172158)
作者简介: 宋彦(通讯作者),男,1972年生,博士,讲师,主要研究方向为多媒体信息处理.E-mail:songy@ustc.edu.cn.蒋兵,男,1987年生,博士研究生,主要研究方向为多媒体信息处理.戴礼荣,男,1962年生,博士,教授,主要研究方向为数字信号处理、模式识别.
引用本文:   
宋彦,蒋兵,戴礼荣. 基于多视觉码本的图像表示[J]. 模式识别与人工智能, 2013, 26(10): 909-915. SONG Yan, JIANG Bing, DAI Li-Rong. Image Representation Based on Multiple Visual Codebooks. , 2013, 26(10): 909-915.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2013/V26/I10/909
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn