模式识别与人工智能
2025年4月3日 星期四   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2020, Vol. 33 Issue (5): 468-476    DOI: 10.16451/j.cnki.issn1003-6059.202005009
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
基于多阶段数据生成的自循环文本智能识别
马新强1,2,3, 刘丽娜2, 李雪维4, 顾晔4, 黄羿1,2,3, 刘勇2
1.贵州大学 计算机科学与技术学院 贵阳 550025;
2.浙江大学 智能系统与控制研究所 杭州 310027;
3.重庆文理学院 大数据智能计算与可视化研究所 重庆 402160;
4.国网浙江省电力有限公司 物资分公司 杭州 310000
Self-circulation Intelligent Text Recognition Based on Multi-stage Data Generation
MA Xinqiang1,2,3, LIU Lina2, LI Xuewei4, GU Ye4, HUANG Yi1,2,3, LIU Yong2
1. College of Computer Science and Technology, Guizhou University, Guiyang 550025;
2. Institute of Cyber-Systems and Control, Zhejiang University, Hangzhou 310027;
3. Institute of Intelligent Computing and Visualization Based on Big Data, Chongqing University of Arts and Sciences, Chong-qing 402160;
4. Material Branch, State Grid Zhejiang Electric Power Co.Ltd., Hangzhou 310000algorithm gains good recognition performance in multiple public English datasets and Chinese-specific complex text scenarios.

全文: PDF (1029 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 

在复杂多样场景下,极少存在同时对英文和中文都具有较优识别效果的大数据标注方法.因此文中提出针对复杂多样文本识别场景的数据生成和多阶段自循环训练算法.按照定义的生成数据参数随机生成文本数据,免去数据标注过程.在卷积循环神经网络的基础上,进行多阶段自循环训练,在循环过程中通过控制数据生成策略不断提升样本的识别精度.实验表明,文中算法在多个公开英文数据集及中文特定的复杂文本场景下都具有良好的识别性能.

服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
马新强
刘丽娜
李雪维
顾晔
黄羿
刘勇
关键词 大数据标注数据生成文本识别卷积循环神经网络(CRNN)    
Abstract

There are few effective big data annotation methods for both English and Chinese recognition in complex and diverse scenarios. Therefore, multi-stage data generation self-circulation training algorithm(MSDG-OCR) for complex and diverse text recognition scenarios is proposed. Text data is generated randomly according to the defined generated data parameters, and the data annotation process is omitted. Grounded on convolutional recurrent neural network(CRNN) model, multi-stage self-circulation training is carried out, and the recognition accuracy of the samples is continuously improved by controlling the data generation strategy during the loop process. Experiments show that the proposed.

Key wordsBig Date Annotation    Data Generation    Text Recognition    Convolutional Recurrent Neural Network(CRNN)   
收稿日期: 2019-09-15     
ZTFLH: TP 391.4  
基金资助:

浙江省重点研发计划项目(No.2019C01004)、广东省重点研发计划项目(No.2019B010120001)、重庆市发改委重大产业技术研发项目(No.2018148208)、重庆市技术创新与应用发展重点项目(No.cstc2019jscx-fxydX0094)、重庆英才创新创业示范团队(No.CQYC201903167)、浙江大学工业控制技术国家重点实验室开放课题(No.ICT170330,ICT1800413,ICT1900358)资助

作者简介: 马新强,博士研究生,教授,主要研究方向为机器学习、大数据.E-mail:xinqma@zju.edu.cn.;刘丽娜,硕士研究生,主要研究方向为深度学习、计算机视觉.E-mail:linaliu@zju.edu.cn.;李雪维,硕士,高级经济师,主要研究方向为计算机应用技术.E-mail:1468832166@qq.com.;顾 晔,硕士,高级经济师,主要研究方向为模式识别.E-mail:gu_ye@zj.sgcc.com.cn.;黄 羿,博士研究生,教授,主要研究方向为人工智能.E-mail:cqhy@21cn.com.;刘 勇(通讯作者),博士,教授,主要研究方向为机器人、深度学习.E-mail:yongliu@iipc.zju.edu.cn.
引用本文:   
马新强, 刘丽娜, 李雪维, 顾晔, 黄羿, 刘勇. 基于多阶段数据生成的自循环文本智能识别[J]. 模式识别与人工智能, 2020, 33(5): 468-476. MA Xinqiang, LIU Lina, LI Xuewei, GU Ye, HUANG Yi, LIU Yong. Self-circulation Intelligent Text Recognition Based on Multi-stage Data Generation. , 2020, 33(5): 468-476.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.202005009      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2020/V33/I5/468
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn