- 无标题文档
查看论文信息

中文题名:

 手写粗体汉字的细化与特征提取研究    

姓名:

 宋莹    

学号:

 1049721201946    

保密级别:

 公开    

论文语种:

 chi    

学科代码:

 070104    

学科名称:

 应用数学    

学生类型:

 硕士    

学位:

 理学硕士    

学校:

 武汉理工大学    

院系:

 理学院    

专业:

 应用数学    

研究方向:

 图像与信息处理    

第一导师姓名:

 王展青    

第一导师院系:

 武汉理工大学    

完成日期:

 2014-10-08    

答辩日期:

 2014-12-05    

中文关键词:

 手写粗体汉字 ; 细化 ; 特征提取 ; LGBP ; Gabor ; 支持向量机    

中文摘要:

    手写体汉字识别是模式识别的一个重要研究课题,目前已有很多研究成果。手写粗体汉字属于手写体汉字的一个研究分支,这些汉字多出现在圆柱体对联、碑文以及书法字中,由于手写粗体汉字的文字获取存在一定困难,且笔画较粗,特征提取复杂,使得整个手写粗体汉字识别系统的建立难于普通的汉字识别系统。考虑专门的研究文献较少,借助类似的识别系统方法,本文建立了初步的手写粗体汉字识别系统。在手写粗体汉字识别系统中,并行与串行细化算法的结合可以弥补单个算法的不足;LGBP算子作为特征提取的算法,简单易操作,Gabor特征能够多尺度多角度反映图像的特征,它们在识别领域已得到较好的应用;同时SVM在分类算法中取得较好的效果,这些算法的结合应用为手写粗体汉字的识别奠定了基础,并能够为古汉字的研究以及历史人文研究提供有利的工具。

    本文的重点在于圆柱面汉字获取、手写粗体汉字细化及特征提取,主要做了以下工作:

    (1)圆柱面手写粗体汉字获取及预处理。借助全景图投影和反投影的思想,提出了改进的柱面反投影方法获得平面的手写粗体汉字。然后对平面手写体粗体汉字进行灰度化、平滑去噪、二值化、图像增强以及文字切分等处理。

    (2)针对手写粗体汉字细化会出现的细化模板较多,细化不全和串行算法的骨架非对称现象,提出了基于并行模板的手写粗体汉字串行细化算法,实验仿真表明该算法模板较少,速度较快,细化完全,骨架对称性较好。字切分等处理。

    (3)介绍了手写体汉字的结构和统计特征提取算法,重点分析了Gabor特征和LBP算法的优点,最终利用LGBP+Gabor算法实现对手写粗体汉字的特征提取。

    (4)利用LGBP+Gabor+SVM组合的算法对手写粗体汉字进行识别。SVM算法是一种基于统计学理论的机器学习算法,有较好的识别效果,通过与其他识别算法比较,证明了本文识别算法对手写粗体汉字识别的有效性。

    最后,本文建立了手写粗体汉字的初步识别系统,并对所做的工作进行了总结与展望。

 

 

参考文献:

[1] Zhang Y T, Zhang X F, Wu J Q, et al. Retrieval of Chinese calligraphic character image [M] Lecture Notes in Computer Science. Heidelberg: Springer, 2005: 17-24.

[2] Zhang Xia-fen, Zhang Yue-ting, et a.l Chinese calligraphic character retrieval based on shape similarity [J]. Journal of Computer-Aid Design & Computer Graphics,2005,17(11):2565-2569.

[3] Lu W, Wu J, Wei B, et al. Efficient shape matching for Chinese calligraphic character retrieval [J]. Journal of Zhejiang University SCIENCE C, 2011, 12(11):873-884.

[4] Yu Kai, Wu Jiang qin, Zhang Yue ting. Calligraphic characters retrieval based on skeleton similarity [J]. Journal of Computer-Aided Design & Computer Graphics, 2009, 21(6): 746-751 (in Chinese).

[5] 俞凯,吴江琴.书法字快速多层检索方法[J].计算机辅助设计与图形学学报,2011,23(8):356-360.

[6] 潘振赣.基于模糊聚类的碑文拓片图像分割算法研究[D].苏州:苏州大学,2010.

[7] 黄维.文物保护中的古汉字图像分割算法研究[D].武汉:华中师范大学,2010.

[8] M Brown, D G Lowe. Automatic panoramic image stitching using invariant features[J].International Journal of Computer Vision, 2007, 74(1): 59-73.

[9] 刘晓妮等.基于OpenCV 的曲面全景投影算法研究[J].计算机仿真,2011,28(2):273-275.

[10]田军,孟祥娟,王萍.全景图中投影模型与算法[J].计算机系统应用,2013,22(5):126-133.

[11] Gonzalez R C, Woods R E. Digital image processing, Prentice Hall, 2002.

[12]Song M, Tao D, et al. Color to Gray: Visual Cue Preservation. IEEE Trans. on PAMI,2010,32(9):1537-1551.

[13]周金和,彭福堂.一种有选择的图像灰度化方法[J].计算机工程,2006,32(22):198-200.

[14]秦志远,吴冰,王艳等.图像平滑算法比较研究及改进策略[J].测绘学院学报,2005,22(2):103-106.

[15]唐雅琴.几种图像平滑去噪方法的比较[J].西南大学学报(自然科学版),2009,31(11):125-128.

[16]Chang S G, Yu B, Vetterli M. Adaptive Wavelet Thresholding for Image Denoising and Compression [J]. IEEE Trans-actions on Image Processing, 2000, 9(9): 1532-1546.

[17]蒙军,索忠乐,陈洪等.一种改进的红外图像增强算法[J],解放军理工大学学报(自然科学版),2004,5(5):5-9.

[18]Rafael C Gonzalez, Richard E. Woods Digital Image Processing[M].北京:电子工程出版社,2003.

[19]Lu Y. Machine Printed Character Segmentation-An Overview[J].Pattern Recognition, 1995, 28(1): 67-80

[20]Casey R G. Lecolinet E. A Survey of Method and Strategies in Character Segmentation [J]. IEEE Trans. PAMI, 1996, 18(7): 690-706.

[21] Lin Yutseng, Chen Rungching. Segmenting Handwritten Chinese Characters Based on Heuristic Merging of Stroke Bounding Boxes and Dynamic Programming[J]. Pattern Recognition Letters, 1998, 19: 963-973.

[22] T. Y. Zhang, C.Y. Suen. A fast parallel algorithm for thinning digital patterns[J]. Communications of the ACM, 1983, 27(3):236-239.

[23] 郑宏, 袁宇正. 基于并行模板的二值地形图串行细化算法[J]. 武测科技, 1996:18-22.

[24] 张学冬, 张任秋, 关云虎等.一种快速的手写体汉字细化算法[J].计算机应用与软件, 2009, 26(11):17-19.

[25] 贺继刚, 杨晓伟, 吴广潮等. 基于模板保留的快速并行细化算法[J].计算机应用与软件,2007, 24(12):26-29.

[26] 魏玮, 刘亚宁.改进的脱机手写体汉字细化算法[J].计算机系统应用, 2011, 20(6):184-187.

[27] 冯星奎, 李林艳, 颜祖泉.一种新的指纹图像细化算法[J]. 中国图像图形学报, 1999, 4(10):835-838.

[28] Wei Chen, Lichuan Sui, Zhang Xu, etal.Improved Zhang-Suen Thinning Algorithm in Binary Line Drawing Application[C]//International Conference on Systems and Informatics. Yantai:[s.n.], 2012:1947-1950.

[29] Zhao Chun-jiang, ShiWen-kang. A robust algorithm for distilling the skeletons of images[J]. ComputaerAppliacation,2005,6(1):1305-1306.

[30] X. Q. Lu, X. J. Liu, Xiao , et al. A segment extraction algorithm based on polygonal approximation or on-line Chinese character recognition[J]. Frontier of Computer Science and Technology, FCST,2008 Japan-China Joint Workshop on; Nagasaki, TBD, Japan. 2008, 2(02): 495-502.

[31] 王建平, 蔺菲, 陈军. 基于手写体汉字笔画提取重构的识别方法[J]. 计算机工程. 2007, 33(10):230-232.

[32] 贾新彪.基于笔画结构特征的脱机手写汉字识别[D].保定:河北大学,2010.

[33]吕岳,施鹏飞.基于汉字结构特征的自由格式手写体汉字切分[J].电子学报.2000,28(5):102-104

[34] 金连文,徐秉铮.手写体汉字识别的一种新的特征提取方法--弹性网格方向分解特征[J].电路与系统学报,1997,2(3):7-12.

[35] Xue Gao,et al.A New Stroke-based Directional Feature Extraction Approach for Handwritten Chinese Character Recognition[C].Proceedings ICDAR2001,USA,2001, 635-639.

[36] 王学文,丁晓青,刘长松.基于Gabor变换的高鲁棒性汉字识别新方法[J].电子学报,2002,30(9) :1317-1322.

[37] DENG HB, JIN LW, ZHEN LX ,et al. A New Facial Expression Recognition Method Based on Local Gabor Filter Bank and PCA plus LDA [J]. International Journal of Information Technology, 2005, 11(11): 86-96.

[38] 王叶,张洪刚,方旭等.基于改进的LBP的低分辨率车牌汉字识别[J].中文信息报,2009,23(5):86-91.

[39] 王玲.基于LBP的特征提取研究[D].北京:北京交通大学,2009.

[40] 王宪,张彦,慕鑫等.基于改进的LBP人脸识别算法[J].光电工程,2012, 39(7):109-114.

[41] Ahonen T,Hadid A,Pietikainen M. Face Description with Local Binary Patterns:Application to Face Recognition[J]. IEEE Transactions on Pattern Analysis And Machine Intelligence(S0162-8828),2006,28(12):2037-2041.

[42] 于明,胡全胜,阎刚等.基于LGBP特征和稀疏表示的人脸表情识别[J].计算机工程与设计,2013,34(5):1787-1792.

[43] 谢琼裕,戴群.融合Gabor和LGBP的单样本人脸识别[J].小型微型计算机系统,2014,35(7):1657-1662.

[44] Yang C,Shi S,Li L,et al. Face recognition with single training sample based on local feature fusion[C]Distributed Computing and Applications to on Business,Engineering and Science(DCABES),Tenth International Symposium on,Wuxi,2011:165-169.

[45] Claus Bahlmann, Bemard Haasdonk, Hans Burkhardt. On-line Handwriting Recognition with Support Vector Machines-A Kemel APProach. IEEE Computer Society.2002,2(1):49-54.

[46] 孙华.基于多特征融合SVM的古汉字图像识别研究[D].长沙:中南大学,2010.

[47] 叶超.基于Gabor小波和SVM的人脸识别算法研究[D].太原:中北大学,2014.

[48] 徐红侠.基于Gabor和局部二值模式的人脸表情识别[D].南京:南京理工大学,2008.

[49] 高涛,何明一,戴玉超.多级LBP直方图序列特征的人脸识别[J].中国图像图形学报,2009, 14 (2):202-207.

[50] Yang Hong, Wang Yi ding.A LBP-based face recognition method with hamming distance constraint [J]. Proceedings of Fourth International Conference on Image and Graphics[C], WashingtonDC, USA, 2007: 645-6491。

[51] 徐冠军.数字图像去噪算法研究[D].杭州:浙江大学,2006.

[52] 高彦平.图像增强方法的研究与实现[D].青岛:山东科技大学,2005.

[53] 张宁.基于摄影方式的二维条形码识别算法的研究[D].南京:南京理工大学,2013.

[54] 陈艳,孙羽菲,张玉志.基于连通域的汉字切分技术研究[J].计算机应用研究,2005:246-248

[55] Liao Zhenwei, Shi Tianyuan, Zhang Kunzong. Tinning algorithm comparison[J],Cadastral Surveying, 2004,20(3):1-18.

[56] 李杰,彭月英,元昌安等.基于数学形态学细化算法的图像边缘细化[J].2012,32(2):514-516.

[57] 张欣.基于四角结构特征的脱机手写体汉字识别[D].保定:河北大学, 2010.

[58] 王建平,蔺菲.基于笔划宽度提取的手写体汉字归一化方法[J].计算机技术与发展,2006,16(10):29-31.

[59] 陈蓉,邓洪波,金连文.一种基于局部Gabor滤波器组的手写体汉字识别方法[J].计算机应用,2007,27(5):1222-1224.

中图分类号:

 TP391.41    

馆藏号:

 TP391.41/1946/2014    

备注:

 403-西院分馆博硕论文库;203-余家头分馆博硕论文库    

无标题文档

   建议浏览器: 谷歌 火狐 360请用极速模式,双核浏览器请用极速模式