模式识别与人工智能
2025年4月13日 星期日   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2012, Vol. 25 Issue (2): 325-331    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
一种基于连通分量的文本区域定位方法
姚金良1,翁璐斌2,王小华1
1。杭州电子科技大学计算机学院杭州310018
2。中国科学院自动化研究所综合信息系统研究中心北京100190
A Text Region Location Method Based on Connected Component
YAO Jin-Liang1, WENG Lu-Bin2 , WANG Xiao-Hua1
1.School of Computer Science and Technology,Hangzhou Dianzi University,Hangzhou 310018
2.Integrated Information System Research Center,Institute of Automation,Chinese Academy of Sciences,Beijing 100190

全文: PDF (797 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 文本区域定位对复杂背景图像中的字符识别和检索具有重要意义。已有方法取得高的定位准确率和召回率,但效率较低,难以应用于实际的系统中。文中提出一种基于连通分量过滤和K-means聚类的文本区域定位方法。该方法首先对图像进行自适应分割,对字符颜色层提取连通分量。然后提取连通分量的特征,并用Adaboost分类器过滤非字符连通分量。最后,对候选的字符连通分量根据其位置和颜色层进行K-means聚类来定位文本区域。实验结果显示该方法具有与当前方法相当的准确率和召回率,同时具有较低的计算复杂度。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
姚金良
翁璐斌
王小华
关键词 文本定位AdaboostK-means聚类文档图像识别    
Abstract:Text region location is important to text recognition and retrieval in images of complex background. The existing methods with precision and recall rate have high computational complexity. These methods are unpractical real environment. A text region location method is proposed based on component filtering and K-means clustering. Firstly, the input image is segmented into three layers by an adaptive image segmentation method, and the components are extracted from the character layers. Then, the features of the component are obtained, and Adaboost classifier is used to filter non-character components. The candidates of character components are grouped into text regions by K-means clustering based on the position and layer of the component. The experimental results demonstrate that the precision and the recall rate of the proposed approach is almost the same that of as the other methods, and the proposed method has lower computational complexity.
Key wordsText Location    Adaboost    K-means Clustering    Document Image Recognition   
收稿日期: 2010-12-27     
ZTFLH: TP391  
基金资助:国家自然科学基金项目(No.61005067)、浙江省科技厅重大专项项目(No.2010C11049)资助
作者简介: 姚金良,男,1979年生,博士,讲师,主要研究方向为模式识别、图像处理。E-mail:yaojinl@hdu。edu。cn。翁璐斌,男,1979年生,博士,助理研究员,主要研究方向为图像处理。王小华,男,1961年生,硕士,教授,主要研究方向为图像处理、自然语言处理。
引用本文:   
姚金良,翁璐斌,王小华. 一种基于连通分量的文本区域定位方法[J]. 模式识别与人工智能, 2012, 25(2): 325-331. YAO Jin-Liang, WENG Lu-Bin, WANG Xiao-Hua. A Text Region Location Method Based on Connected Component. , 2012, 25(2): 325-331.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2012/V25/I2/325
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn