文档视界 最新最全的文档下载
当前位置:文档视界 › 基于汉字连通分量的印刷图像版面分割方法

基于汉字连通分量的印刷图像版面分割方法

Computer Engineering and Applications 计算机工程与应用

2015,51(5)1引言文字具有较强的指示性同时也包含重要的语意信息,如书刊封面文字、报纸文字、产品包装上的文字等等,这些文字对于包装产品消费者以及书刊、报纸阅读者具有重要价值,如果存在文字印刷质量缺陷,将对书刊、报纸以及包装产品带来不可估量的损失。然而,传

统印刷质量检测以色差作为最主要的检测标准,并没有单独对文字印刷质量进行检测。而在印刷生产过程中,文字经常出现笔画残缺、白点、断笔、边缘不清等缺陷,而色差标准并不能检测出这些缺陷。因此,通过版面分基于汉字连通分量的印刷图像版面分割方法

付芦静1,钱军浩1,钟云飞2

FU Lujing 1,QIAN Junhao 1,ZHONG Yunfei 2

1.江南大学物联网工程学院,江苏无锡214122

2.湖南工业大学包装与材料工程学院,湖南株洲412007

1.School of Internet of Things Engineering,Jiangnan University,Wuxi,Jiangsu 214122,China

2.School of Packaging and Materials Engineering,Hunan University of Technology,Zhuzhou,Hunan 412007,China

FU Lujing,QIAN Junhao,ZHONG Yunfei.Printed image layout segmentation method based on Chinese character connected https://www.docsj.com/doc/0718577855.html,puter Engineering and Applications,2015,51(5):178-182.

Abstract :Contraposing the background color of the color printed image is plentiful and Chinese character has multiple connected components,text segmentation algorithm of connected domain can ’t accurately extract text.A method of color printed image ’s layout segmentation based on Chinese character connected component is proposed.Image is prepro-cessed via inverse halftoning algorithm of pyramid transforming.Then,it segments image color through color sampling and mean shift and marks text connected components.It reconstructs Chinese character connected component according to the structure of characters and connected components feature.Finally,the connection relations of characters connected components are analyzed to determine the orientation of text and realize text segmentation.The experimental results show that the method can effectively reconstruct character connected component and achieve text segmentation on color printed image for different font,font size and color.

Key words :text segmentation;connected component reconstruction;inverse halftoning;color sample;mean shift;clus-tering center

摘要:针对彩色印刷图像背景色彩丰富和汉字存在多个连通分量,连通域文字分割算法不能精确提取文字,提出基于汉字连通分量的彩色印刷图像版面分割方法。利用金字塔变换逆半调算法对图像进行预处理,通过颜色采样和均值偏移分割图像颜色,标记文字连通分量,根据汉字结构和连通分量特性重建汉字连通分量,分析文字连通分量连接关系确定文字排列方向实现文字分割。实验结果表明,该方法能够有效地重建汉字连通分量,在彩色印刷图像中实现对不同字体、字号、颜色的文字分割。

关键词:文字分割;连通分量重建;逆半调;颜色采样;均值偏移;聚类中心

文献标志码:A 中图分类号:TP391doi :10.3778/j.issn.1002-8331.1304-0312

基金项目:湖南省自然科学基金重点资助项目(No.10JJ2048);湖南工业大学自然科学研究项目(No.2011HZX03);湖南省自然科

学省市联合基金项目(No.12JJ9043)。

作者简介:付芦静(1989—),男,硕士研究生,主要研究领域为图像处理、印刷图像质量在线检测;钱军浩(1969—),男,副教授,主

要研究方向印刷控制与管理技术、信息传媒技术及应用;钟云飞(1975—),男,副教授,主要研究方向为图像处理和模式识别。E-mail :kuaileangle0415@https://www.docsj.com/doc/0718577855.html,

收稿日期:2013-04-22修回日期:2013-06-24文章编号:1002-8331(2015)05-0178-05

CNKI 网络优先出版:2013-07-31,https://www.docsj.com/doc/0718577855.html,/kcms/detail/11.2127.TP.20130731.1817.001.html

178

相关文档
相关文档 最新文档