模式识别与人工智能
2025年4月13日 星期日   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2018, Vol. 31 Issue (4): 335-346    DOI: 10.16451/j.cnki.issn1003-6059.201804005
综述与评论 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于深度卷积网络的目标检测综述
吴帅1, 徐勇1, 赵东宁1,2
1.哈尔滨工业大学 深圳研究生院 智能感知与生物信息学创新团队 深圳 518000
2.深圳大学 信息工程学院 深圳 518000
Survey of Object Detection Based on Deep Convolutional Network
WU Shuai1, XU Yong1, ZHAO Dongning1, 2
1.IntelliSense and Bioinformatics Innovation Team, HIT Institute of Technology Shenzhen Graduate School, Harbin Institute of Technology, Shenzhen 518055
2.College of Information Engineering, Shenzhen University, Shenzhen 518000

全文: PDF (1291 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 

在基于区域的卷积神经网络提出后,深度卷积网络开始在目标检测领域普及,更快的基于区域的卷积神经网络将整个目标检测过程合成在一个统一的深度网络框架上.随后YOLO和SSD等目标检测框架的提出进一步提升目标检测的效率.文中系统总结基于深度网络的目标检测方法,归为2类:基于候选窗口的目标检测框架和基于回归的目标检测框架.基于候选窗口的目标检测框架首先需要在输入的图像上产生很多的候选窗口,然后对这些候选窗口进行判别.这里的判别包括:对窗口包含物体的类别(包括背景)进行判断、对窗口的位置进行回归.基于回归的目标检测方法将图像目标检测看作是一个回归的过程.在此基础上,在PASCAL_VOC和COCO等主流数据库上对比目前两类目标检测框架中的主流方法,分析两类方法各自的优势.最后根据当前深度网络目标检测方法的发展趋势,对目标检测方法未来的研究热点做出合理预测.

服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
吴帅
徐勇
赵东宁
关键词 深度卷积网络目标检测候选窗口感兴趣区域(ROI)池化    
Abstract

Deep convolutional network is prevalent in object detection task. Region-based convolutional neural network(RCNN) bridges the gap between the classification of deep convolutional network and the object detection task well. Then the whole object detection process is aggregated into a unified deep framework by Faster-RCNN. You only look once(YOLO) and single shot multibox detector(SSD) effectively improve the efficiency of object detection. Different deep object detection frameworks are comprehensively analyzed and divided into two categories: the proposal based framework and the regression based framework. The proposal based framework is utilized to generate thousands of candidate proposals and then classification and bounding box regression are conducted on these proposals. The regression based framework outputs the bounding box position through some special iterations directly. Furthermore, the advantage for different kinds of frameworks is demonstrated through adequate experiments on the mainstream database like PASCAL_VOC and COCO. Finally, the development direction of object detection is discussed.

Key wordsDeep Convolutional Network    Object Detection    Candidate Proposals    Region of Interest(ROI) Pooling   
收稿日期: 2018-01-15     
ZTFLH: TP 391.4  
作者简介: 吴 帅,博士研究生,主要研究方向为模式识别、深度学习.E-mail:949766996@qq.com;徐 勇,博士,教授,主要研究方向为模式识别、人工智能、图像处理等.E-mail:yongxu@ymail.com;赵东宁,博士,主要研究方向为多媒体信息处理、大数据技术、人工智能.E-mail:582101@qq.com.
引用本文:   
吴帅, 徐勇, 赵东宁. 基于深度卷积网络的目标检测综述[J]. 模式识别与人工智能, 2018, 31(4): 335-346. WU Shuai, XU Yong, ZHAO Dongning. Survey of Object Detection Based on Deep Convolutional Network. , 2018, 31(4): 335-346.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201804005      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2018/V31/I4/335
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn