|
|
|
基于图像识别的答题卡识别系统的设计与实现
|
|
【建筑经济论文】摘 要:本文综合运用图像处理,模式识别的理论来构建答题卡的识别系统。当前使用的答题卡阅读机,均采用光反射阅读方式。要求使用指定的铅笔,按严格的格式涂填。这与平时的习惯差距较大,容易发生人为失误。这里,采用图象处理和模式识别技术,对答题卡进行阅读,希望 摘 要:本文综合运用图像处理,模式识别的理论来构建答题卡的识别系统。当前使用的答题卡阅读机,均采用光反射阅读方式。要求使用指定的铅笔,按严格的格式涂填。这与平时的习惯差距较大,容易发生人为失误。这里,采用图象处理和模式识别技术,对答题卡进行阅读,希望解决对书写工具约束、需要特制答题卡等问题。实现了答题卡的计算机识别 ,采用打钩的方法答题,方便,快速。 0时,沿横向坐标轴右移,否则向相反方向移动。因此,我们可以将上式改写成以下形式,而不会改变小波变换的实际意义。 (1) 尺度a的选择可以根据需要直接调整,计算是直接依赖于最原始的。Marr小波函数的系数只是影响波形的幅值,其有无不会使波形失真,因此选取的小波基函数为: (2) 可以近似地认为其支集为[-7,7],在这个区间以外,Marr小波基本为0。由于涉及到指数函数的计算,我们采用插值的技术来计算Marr小波的近似值,即预先计算好从[0,7]的每隔0.05的值共141点(在程序初始化或某个类的构造中如此选定),然后通过普通的插值来实现小波基函数的计算。又由于该小波基函数的对称性,可以得到自变量小于0的各个函数值。求解Marr小波函数的具体算法如下: 由于Marr小波函数的对称性,我们只离散化采样其非负时间轴的值,并且认为时Marr小波值为0。采样时间为取采样时间间隔(采样步长)为0.05,由式(2),Marr小波离散化采样值为: (3) 当Marr小波时间变量time不是0.05的整数倍时,需要用插值计算法求出。在此之前,要考虑time<0的情况。由于Marr小波是关于t=0对称的,可作如下变换: time= -time,time<0(4) 此时无论原始时间变量是否为正,time都已转换成非负值。进一步: (5) 设int[x]表示取的整数部分,引入整数变量: (6) 此时,就可以用插值法完成对各个具体点的Marr小波函数值wave(time)的求取: (7) 下面叙述如何用计算机实现式(1)定义的连续小波变换。采用最简单的数值积分方法―矩形法,也就是按照数字信号处理的习惯将式(1)按时间,时移因子作处理: 其中,是采样时间间隔,取,则: 其中f(j.dt),是待分析信号按照采样时间间隔连续采集的数据,设存放于数组tp[j]中,将式(3)~(7)求出的小波函数的离散化形式带入,得出: (8) 上述小波变换结果存放在数组中,即: (9) (五) 区域填充的扫描线算法的实现 区域填充可以使用递归算法实现,其原理和程序都很简单,但由于多次递归,费时、费内存,效率不高。为了减少递归次数,提高效率可以采用采用扫描线算法。 算法的基本过程如下:当给定种子点(x,y)时,首先填充种子点所在扫描线上的位于给定区域的一个区段,然后确定与这一区段相连通的上、下两条扫描线上位于给定区域内的区段,并依次保存下来。反复这个过程,直到填充结束。 区域填充的扫描线算法可由下列四个步骤实现: (1)初始化:堆栈置空。将种子点(x,y)入栈。 (2)出栈:若栈空则结束。否则取栈顶元素(x,y),以y作为当前扫描线。 (3)填充并确定种子点所在区段:从种子点(x,y)出发,沿当前扫描线向左、右两个方向填充,直到边界。分别标记区段的左、右端点坐标为xl和xr。 (4)确定新的种子点:在区间[xl,xr]中检查与当前扫描线y上、下相邻的两条扫描线上的象素。若存在非边界、未填充的象素,则把每一区间的最右象素作为种子点压入堆栈,返回第(2)步。 上述算法对于每一个待填充区段,只需压栈一次;而在递归算法中,每个象素都需要压栈。因此,扫描线填充算法提高了区域填充的效率。 3 实验结果与分析 实验采用数码相机拍摄答题卡图像,进行图像预处理、答题卡的标定位置识别,答题卡的涂填处识别,判定矩形框中有无字符、是什么字符,最后对答题卡信息分析和统计。实验采用80份试卷作为样本,对12份试卷进行测试,结果识别率达到100%。 4 结论 本文采用图象处理和模式识别技术,对答题卡进行阅读。在实验中以深色笔对答题卡进行勾选,经过数码相机拍摄答题卡,采集样本,进行答题卡的自动识别。实验表明识别率达到100%,解决了对书写工具约束、采用打钩的方法答题,方便,快速。 参考文献 [1]吴元君,张婷,雷惊鹏.一种改进的OMR 技术在标准化考试中的应用[J].计算机教育,2007(13):250-272. [2] 庞东虎,金伟杰.英文字符特征提取系统[J].计算机仿真,2007,24(12):208-210. [3] 杨玲,毛以芳,吴天爱.基于多特征多分类器的脱机手写汉字识别研究[J].计算机与网络,2008(01):217-217. [4] 覃胜,刘晓明.基于图像的OMR技术的实现[J].电子技术应用,2003,29(10):17-19. [5] 何斌,《Visual C++数字图象处理》[M],人民邮电出版社,2002-4 作者简介 陈伟华(1977-),湖北襄樊, 讲师, 硕士,主要研究方向:计算机教学与.net项目开发。
|
|
|
|