本文包含原理图、PCB、源代码、封装库、中英文PDF等资源
您需要 登录 才可以下载或查看,没有账号?注册会员
×
摘 要: 在分析图像中字符特点的基础上,研究其在小波变换域中的特征,依据这些特征,分析频率加权阈值法和利用块间信息的平均阈值法的优缺点,将二者结合进行图像字符定位。实验表明,该算法可进行图像中的字符定位,同时又可以弥补两种方法定位时的不足。
关键词: 字符定位; 小波变换; 加权系数
随着计算机性能的提升和数字化存储技术的不断发展,从海量的视频资料中找到想要的信息已经成为十分迫切的需求,所以对视频内容的分析、建立基于内容的索引以及视频内容的结构化描述成为近年来研究的热点。字符的分析与处理是视频分析的重要内容,进行图像字符分析处理的基础就是探测图像中字符的出现及定位其准确坐标。
目前对图像中的字符定位方法大致可以分为两大类:一类是在原像素域内的处理方法[1-2] ,其主要是根据字符的纹理特征或结构特征来定位字符;另一类是基于压缩域的处理方法[3-5],主要是DCT变换域和小波域,主要依据字符的笔划边缘在频域中表现较大的系数和方向性,利用这些系数来进行字符定位。在压缩域中,这些方法能够充分利用图像中的字符在频率变换域中的特点,且只需要进行简单的解码,其处理的速度较快,具有较高的正确检测率,是目前研究的热点。参考文献[6]提出了小波变换域的图像字符定位方法,并通过对大量图像字符定位的研究表明,该方法适应性强, 但处理背景复杂的图像效果稍微差一些。而参考文献[7]在定位时采用加权频率的方法,在对背景复杂度高的图片进行定位时有较好的效果,但是该方法处理一些较小的英文字符时漏检较多。本文在分析参考文献[6-7]的基础上,先对小波变换系数进行非线性加权,然后再采用自适应动态阈值及结合块间信息来提高检测的正确率及算法的适应性。
1 小波变换域能量表征及分类
字符可能出现在图像和视频中的任何地方,但并不是所有出现的字符对视频和图像都有内容上的相关。 将视频中出现的字符分为人工字符和背景字符两类[1]。人工字符本身有特定的笔划结构,在空间上表示为水平、竖直以及对角线方向的笔划。字符灰度变化不大,但边缘变化较大,有突出的水平、竖直以及斜向的纹理特征。本文主要研究人工字符定位,利用人工字符的这些特征可以将字符区间和背景分开,对字符进行定位。
对图像信号进行小波变换,可以将其分解为平均部分、垂直细节部分、水平细节部分以及对角线细节部分,这些刚好对应于图像中字符的笔划特点。在小波变换域上进行字符定位的主要步骤就是给出标志字符中笔划走向对应的频率变化的能量。设图像f(i,j)经小波变换后对应的小波系数为C(i,j),如图1所示。
|