找回密码
 注册会员
更新自动建库工具PCB Footprint Expert 2024.04 Pro / Library Expert 破解版

[嵌入式/ARM] 数据融合在车牌字符识别中的应用

[复制链接]
admin 发表于 2013-3-25 19:56:40 | 显示全部楼层 |阅读模式

本文包含原理图、PCB、源代码、封装库、中英文PDF等资源

您需要 登录 才可以下载或查看,没有账号?注册会员

×
摘  要: 将D-S证据理论引入车牌字符识别,结合神经网络容错能力强、能够自适应学习等优点,对待识别字符进行统计和结构等多方面的特征提取后,分别经过神经网络分类器得到相应的结果,并应用D-S证据理论对各种结果进行数据融合,从而实现了字符各方面特征的优势互补,进一步提高了字符识别的成功率。
关键词: 字符识别;特征提取;D-S证据理论;数据融合
    字符识别是模式识别的一个重要分支,是LPR系统中最后一个环节,同时也是一个典型的大类别数模式识别问题。在车牌字符识别的过程中需要处理大量字符信息,传统的字符识别流程如图1所示。
    20121107045901938801214.gif
    通常提取的特征主要有纹理特征、颜色特征、形状特征和空间关系特征等[1]。本文将待识别字符的统计特征和结构特征都提取出来,扬长避短,发挥各自优点。分别使用神经网络的分类器得到相应的结果,再将各种结果通过D-S证据理论进行数据融合,充分利用字符各方面特征,从而达到进一步提高字符识别成功率的目的。
1 字符识别
1.1 预处理

 对输入的数字图像先进行定位、二值化、去噪和大小规格化等预处理工作,这一环节是字符识别的重要步骤。二值化主要把原始图像转换成识别器所能接收的形式,尺寸和位置的规格化主要是消除一些与类别无关的因素。
1.2 特征提取
 本文主要从待识别字符中提取基于网格特征和基于方向线素特征两组统计特征,后者主要是对数字图像分别在水平方向和垂直方向三等分的地方作水平线和垂直线穿过字符看其与字符边缘交叉的次数,以此作为特征进行提取。虽然这两组特征已然包含了较多的信息,具备一定的识别成功率,但是仅从这两个特征入手还存在明显的不足:(1)它们都是在尺寸归一化以后进行的,宽高比信息并没有体现出来,这样常导致“1”与其他的数字混淆;(2)由于是统计特征,对字形结构的描述不足,使得一些在统计特征上差别很小但结构完全不同的字符发生混淆,如“3”和“8”。鉴于此,本文又引入了宽高比和孔洞数两个结构特征。诚然,仅凭这两个结构特征并不能完成彻底的分类效果,但与前面的统计特征有很好的独立性,通过合适的集成方式,能够进一步提高系统的识别成功率。
1.3 BP神经网络分类器
 BP神经网络的核心目的是通过梯度下降法让网络的实际输出和期望的均方差最小。BP神经网络学习训练的过程由信息的正向传播和误差的反向传播两个过程组成。当实际输出与期望输出不符时,进入误差的反向传播阶段。神经网络学习训练的过程就是周而复始的信息正向传播和误差反向传播过程,同时也是各层权值不断调整的过程。该过程一直持续到网络实际输出的误差减少到可以接受的程度,或者预先设定的学习次数为止。
 虽然BP神经网络具有一定的先进性,但也存在着一定的缺陷:
 (1)BP算法根据梯度下降学习法进行学习时,可以使权值收敛到某个值,但无法保证该值为误差平面的全局最小值。可以采用附加动量法来解决该问题。
 (2)隐层和隐层节点的数目尚无理论上的指导,只能通过经验或反复实验确定。
 (3)由于学习的速率是固定不变的,因此BP神经网络收敛的速度比较慢,训练时间较长。
 (4)网络的学习和记忆具有不稳定性。
 因此,在字符识别的过程中,如果应用BP神经网络的方法,还需要根据具体的情况做相应的修改,使其发挥应有的优势。
 本文采用3组BP神经网络作为分类器,输入向量分别为以上提取的统计和结构特征向量,统计特征向量包括粗网格特征和方向线素特征两组,结构特征向量为宽高比和孔洞数。输出向量为3组向量,第1组为42维向量,其中每个分量分别与32个省市区汉字的简称和10个部队、军区等特殊机关部门的简称相对应;第2组为26维向量,其中每个分量分别与英文字母A~Z相对应;第3组为10维向量,其中每个分量分别与数字0~9相对应。传递函数采用Sigmoid函数。训练时,对应每个输入的数字图像,输出向量中相应位置分量赋值1;测试时,为了得到下一步证据理论所需的基本概率数,还需对输出向量的分量按式(1)进行处理:
20121107045901985671215.gif
20121107045902001291216.gif
 (3)不确定性区间长度必须小于某一阈值r;
 (4)目标类别的信任度值必须大于不确定性区间长度。
 关于阈值的选取并没有一个统一的标准,只能根据实际情况加以确定,阈值过大或过小都会直接影响到识别成功率,本文选取ε=0.1,r=0.3。
2 实验结果分析
 本文所设计的车牌识别系统Vision1.0采用VisualC++6.0开发工具,并在具有Core(TM)2Duo CPU、2 GB内存的计算机上实验得到数据,支持像素100×100以上BMP和JPG格式图像文件,具有一定的识别精度。
部分车牌识别实验的结果如图2~图7所示,实验结果分析如表1所示。
    20121107045902016921217.gif
*滑块验证:
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

QQ|手机版|MCU资讯论坛 ( 京ICP备18035221号-2 )|网站地图

GMT+8, 2024-12-28 06:05 , Processed in 0.055255 second(s), 9 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表