华拓科技网
您的当前位置:首页文字识别领域中模式识别技术的应用

文字识别领域中模式识别技术的应用

来源:华拓科技网
科技资讯

2015 NO.27

SCIENCE & TECHNOLOGY INFORMATION

信 息 技 术

DOI:10.16661/j.cnki.1672-3791.2015.27.006

文字识别领域中模式识别技术的应用①

江波 史凤波

(吉林化工学院信息与控制工程学院 吉林吉林 132022)

摘 要:随着科学信息技术的不断发展,计算机技术也得到了快速地发展和广泛地应用,同时也促使模式识别技术在文字识别领域得到广泛的应用。近些年来,模式识别技术的发展和应用也得到了广大专家学者和社会的关注和重视。该文主要从模式识别技术的发展历史和现状出发,对文字识别的基本原理进行阐述,对其统计决策及字句结构等基础识别方法及在文字识别领域的相关应用进行研究分析和总结,并对模式识别技术领域的前景和未来做出展望。关键词:文字识别 模式识别 应用 科技信息技术中图分类号:TP391.4

文献标识码:A

文章编号:1672-3791(2015)09(c)-0006-02

随着高科技信息技术的快速发展,计算机技术在存取信息、输出和高速运算等方面得到了不断的完善和健全,但目前计算机的信息输入还是主要依靠人工,文字识别中的模式识别技术主要是运用大脑识别机理通过计算机的模拟工作,从而构造出一个完全能够代替人工完成分类的识别等工作,以达到实现自动信息处理的机器系统的目的[1]。随着人工智能、思维科学和计算机技术迅速发展,在文字识别领域的模式识别技术也在不断的向更深、更高层次发展。模式识别主要是由模糊理论、统计、神经网络、句法结别的应用原理做出分析。

2 模式识别技术的应用方法

2.1 统计识别

在数学决策理论的基础上,产生了一种新的识别方法,也就是统计识别方法。在进行特征提取时,就可以采用统计识别的方法,这时可以将相应的特征向量通过一个特征空间进行定义,全部的特征矢量都在这个特征空间内。这个特征空间的点都能与各种对象及特征向量之间进行对应。在分类阶段中,通常采用统计决策的方法完成对特征空间信息的分类,以此来达到对各类特征对象识别的目的效果。随着科学技术的进步,我国的统计识别技术已经逐渐成熟,尤其是对特征提取的识别。2.2 模糊识别

模糊识别的方法主要是采用模糊数学的原理、概念和方法解决分别识别中存在的问题。模糊识别根据识别事物逻辑思维与吸取大脑识别的特征,把计算机中的二位逻辑不断地向连续逻辑进行相关的转化。模糊识别的结果根据已经被采用被识别对象所属于的某个类别程度,也就是隶属度得出结果,一个对象可以适应于不同的类别或不同程度的类别。通常情况下,一个对象只可以对应某一个类别。单模糊集理论就是将识别方法按模糊聚类法、择近原则识别法或最大隶属原则识别法分为多个类别[3]。2.3 神经网络识别

20世纪50年代,一些相关技术人员对动物神经系统的某些功能进行了研究分析,并对其进行模拟,他们通过使用计算机技术对大量的数据进行处理,从中实现了处理单元结点的建立,这种单元的出现为互联拓扑网络的建立提供了依据,被称之为人工神经网络[4]。人工神经网络可以将不同的处理单元进行互连成为一个网络,在进行识别分类的过程中,能够通过网络对人的神经系统进行相关模仿,从而实现分类的效果。这种网络识别方式相比于其它识别方法存在较大的差别,人工精神网络对识别的对象不需要要求有过多的认识和分析,并且可以实现智能化处理。神经

.com.cn. All Rights Reserved.构以及支持向量机识别等方法,笔者就文字识别领域的中模式识

1

模式识别系统的基本概念

人们在看到某个事物和现象时会不自觉的收集该事物或现象的相关信息,并将该信息与大脑中已经储存的信息进行匹配或比较后得出相应的结果。对该事物或现象中所获取到的时间及空间信息将其统称为模式。而将模式中同一类别模式统称为模式类[2]。当需要将具体的样本进行归类时就叫做模式分别或模式识别。模式识别系统通常由四部分组成,分别为数据获取、数据预处理、数据的特征提取及选择和分类决策。数据获取指的是把输入模式切换成适合计算机处理形式的一个过程。数据预处理主要是将多余的噪音去除,从中提取需要的信息,通过专业的输入设备对残缺的信息进行必要的修复和处理,以便于计算机提取特征,在通过数据获取和预处理后输入信息的数据维数较高,为了达到分类识别的目的,对原始数据进行处理过程中,通过相互的转换从数据中提取出最原始的模式特征。原始数据空间又可以被称为测量空间,而分类识别都是在一个称为特征空间中进行的。所谓的模式识别系统指的是在测量空间模式中,维数由低向高的转化的过程,这也是该系统通常采用的特诊提取及特诊选择。文字算法是文字识别的关键和核心。

①作者简介:江波(1980—),女,吉林吉林人,硕士,讲师,研究方向:模式识别与智能系统。

史凤波(1979—),女,吉林吉林人,硕士,讲师,研究方向:模式识别与智能系统。

6科技资讯 SCIENCE & TECHNOLOGY INFORMATION

信 息 技 术

网络可以实现和模拟人认知过程中的形象思维、感知觉、分布式记忆、自组织与自学习,同时神经网络识别方法和符号处理之间可以实现互补的作用,主要用于有处理需求且要考虑诸多条件和因素,信息模糊或不精准的信息处理。2.4 句法结构识别

句法识别是统计识别的基础上进行的延伸和补充,统计识别主要是通过利用数值对图像的主要特征进行相应的描述,而句法结构识别主要是通过符号的特征描述图像。而句法结构识别通过对语言学中句法层次结构进行一定的模仿,通过利用分层描述的技术对图像进行层次分解,从中获得较为简单的子图像,这种识别方法体现出了识别对象各层次的信息。图像识别的方法也是在统计方法的基础上进行的延伸,而句法结构识别方法的识别能力较图像识别的识别能力明显提升,句法结构识别不在是单纯的对象物进行归类处理,对物体结构和景物同样具备识别能力。2.5 支持向量机的模式识别

支持向量机的核心思想主要是在特征或样本空间中打造一个最优的超平面,而这个最优超平面与各种类样本集之间的距离最大,就是要使其达到最大的泛化能力。支持向量机具有泛化能力强、结构相对简单、全局最优性等特点,关于支持向量机的模式识别在20世纪90年代中期提出后就得到了大量的专家和学者的重视,并得到了较为广泛的认知和应用[5]。支持向量机识别解决了函数估计和模式识别等问题。在数字图像处理中具有寻找图像像素的特征,可根据像素点的特征和周围的环境检测出其差异,并具(上接5页)

绩分组:根据预赛成绩分组,按成绩优先分道。(5)打印:主要包括径赛成绩卡片打印;径赛卡片打印;跳远成绩记录表打印;跳高成绩记录卡片打印;)竞赛程序编排打印及秩序册内容打印。

1.2.3 成绩管理

(1)成绩录入:可按项目、按组录入成绩,当某一项目成绩录入完毕,系统将自动按成绩进行排名和记分。(2)单位自动排名:当所有项目成绩(决赛成绩)录入完毕,系统将自动计算得分,并自动排名。(3)单位参赛人员成绩打印:按单位打印参赛人员成绩。

1.2.4 系统设置

参赛单位编辑;比赛项目名称编辑;大会记录等。1.3数据库设计

通过对高校运动会管理的业务调研与分析,得到主要的业务流程和主要业务数据,通过对主要业务数据的分析与研究,确定系统数据的实体模型(E-R图)。依据实体属性可能设计数据库表的结构,每个实体或联系对应一个关系表。最后选择关系数据库管理系统(DBMS)建立数据库。

2015 NO.27

SCIENCE & TECHNOLOGY INFORMATION

科技资讯

备各像素点区分功能。

3 结语

随着科技的进步和信息技术的发展,利用计算机技术对文字进行识别的应用越来越广泛,该文通过模式识别技术的几种应用方法进行了简单分析,对其在统计识别、模糊识别、神经网络识别、句法结构识别、支持向量机的模式识别的应用上加以总结和归纳,从中了解到模式识别技术还具有巨大的发展空间,通过人们的不断研究,模式识别技术不仅能够更好的应用到文字识别中,同时还能够广泛的应用到其它领域中。

参考文献

[1]张俊玲,赵林.模式识别的方法与应用[J].产业与科技论坛,

2014(13):131-132.

[2]高翔,邢玉娟.模式识别及其在图像处理中的应用[J].自动化

与仪器仪表,2015(3):102-103.

[3]罗笑玲,黄绍锋,欧阳天优,等.基于多分类器集成的图像文字

识别技术及其应用研究[J].软件,2015,36(3):98-102.[4]崔志国,曾丽娟,李晓静.创新技术与应用模式提升勘验系统

应用效率[J].技术,2011(2):26-28.

[5]李新良.模式识别理论的研究与应用[J].北京电子科技学院学

报,2011(4):75-79.

.com.cn. All Rights Reserved.决赛分道次,主要是依据预赛成绩名次排序,然后按45362718分配。(3)田赛出场顺序编排:利用随机函数产生顺序号。2.2主要技术与开发工具

(1)开发工具:PowerBuilder8.0为前台开发工具,主要完成运动会的分组、编排、各种竞赛卡片的打印及成绩管理与成绩排名;Visaul studio 2008实现网上报名模块的开发。选用SQLServer2008作为后台数据库。(2)采用PB数据窗口技术实现在交互界面上进行数据的录入、查询、更新等操作。数据窗口技术编程量极小,因而,简化了界面设计过程,方便实现对后台数据的交互操作。

3 结语

系统在投入运行之前,需要进行功能性测试。主要通过以往手工处理的数据进行了测试,检验数据的准确性和功能是否达到设计要求。为客户端制作了安装盘,实现自动安装和自动设置。系统使用提高了运动会管理的效率和准确性。

参考文献

2 主要技术及算法

2.1主要算法

(1)分组:同班不在同组,可先按班名、项目进行排序,然后分配组号(连续号),这样可以避免同班分在同一组。这个前提是同班同一个项目参赛人数不超过分组数。(2)竞赛分道:对于预赛而言,可以利用随机函数产生,若重新生成,则结果与上一次不同;对于

[1]张海藩.软件工程导论[M].北京:清华大学出版社,1998.[2]赵强.SQL Server数据库编程技法范例[M].北京:清华大学出

版社,2005.

[3]刘槐德.高校运动会综合信息管理系统的设计与实现[D].重

庆:重庆大学,2009.

科技资讯 SCIENCE & TECHNOLOGY INFORMATION7

因篇幅问题不能全部显示,请点此查看更多更全内容