模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2020, Vol. 33 Issue (10): 951-958    DOI: 10.16451/j.cnki.issn1003-6059.202010010
“结构化特征学习的目标检测与识别”专辑 最新目录| 下期目录| 过刊浏览| 高级检索 |
时序增强的视频动作识别方法
张浩博1,2, 付冬梅1,3, 周珂4
1.北京科技大学 自动化学院 北京 100083;
2.北京科技大学 顺德研究生院 佛山 528399;
3.北京科技大学 北京市工业波谱成像工程中心 北京 100083;
4.北京科技大学 高等工程师学院 北京 100083
Video-Based Temporal Enhanced Action Recognition
ZHANG Haobo1,2, FU Dongmei1,3, ZHOU Ke4
1.School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing 100083;
2.Shunde Graduate School, University of Science and Technology Beijing, Foshan 528399;
3.Beijing Engineering Research Center of Industrial Spectrum Imaging, University of Science and Technology Beijing, Beijing 100083;
4.School of Advanced Engineering, University of Science and Technology Beijing, Beijing 100083

全文: PDF (3103 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 针对视频动作识别中的时空建模问题,在深度学习框架下提出基于融合时空特征的时序增强动作识别方法.首先对输入视频应用稀疏时序采样策略,适应视频时长变化,降低视频级别时序建模成本.在识别阶段计算相邻特征图间的时序差异,以差异计算结果增强特征级别的运动信息.最后,利用残差结构与时序增强结构的组合方式提升网络整体时空建模能力.实验表明,文中算法在UCF101、HMDB51数据集上取得较高准确率,并在实际工业操作动作识别场景下,以较小的网络规模达到较优的识别效果.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
张浩博
付冬梅
周珂
关键词 动作识别深度学习时序增强结构工业监控视频    
Abstract:Aiming at the spatio-temporal modeling in video action recognition, a temporal enhanced action recognition algorithm based on fused spatio-temporal features is proposed under the deep learning framework. To lower the cost of video-level temporal modeling, a sparse sampling strategy is employed to adapt to video duration changes. In the recognition stage, temporal difference between adjacent feature maps is calculated to enhance the motion information in the feature level. The combination of residual structure and temporal enhanced structure is introduced to further improve the representation ability of the network. Experimental results show that the proposed algorithm obtains higher accuracy on UCF101 and HMDB51 datasets and achieves better results in the actual industrial operation recognition scene with a smaller network scale.
Key wordsAction Recognition    Deep Learning    Temporal Enhanced Structure    Industrial Surveillance Video   
收稿日期: 2020-05-16     
ZTFLH: TP391.4  
通讯作者: 付冬梅,博士,教授,主要研究方向为图像处理、数据挖掘.E-mail:fdm2003@163.com.   
作者简介: 张浩博,硕士研究生,主要研究方向为深度学习、视频动作识别.E-mail:929817721@qq.com. 周 珂,硕士,高级工程师,主要研究方向为深度学习、图像识别.E-mail:zhouke@ustb.edu.cn.
引用本文:   
张浩博, 付冬梅, 周珂. 时序增强的视频动作识别方法[J]. 模式识别与人工智能, 2020, 33(10): 951-958. ZHANG Haobo, FU Dongmei, ZHOU Ke. Video-Based Temporal Enhanced Action Recognition. , 2020, 33(10): 951-958.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202010010      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2020/V33/I10/951
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn