[发明专利]一种基于距离优化降维的手写字体识别系统有效
申请号: | 201610048955.3 | 申请日: | 2016-01-25 |
公开(公告)号: | CN105740784B | 公开(公告)日: | 2019-01-08 |
发明(设计)人: | 康琦;张华巍;曹贻社;郝进伟;曲毅 | 申请(专利权)人: | 毅康科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 马国冉 |
地址: | 264006 山东省烟台*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 距离 优化 手写 字体 识别 系统 | ||
本发明属于图像处理与识别技术领域,尤其涉及一种基于距离优化降维的手写字体识别系统,包括手写字体库、手写字体识别平台、手写字体输出模块,所述手写字体识别平台包括采用的识别方法包括第一步骤、第二步骤、第三步骤、第四步骤、第五步骤、第六步骤,本发明解决了数据挖掘、处理手段往往对低维数据有效,高维数据由于经常包含大量冗余信息、对结果影响较小的变量、与其他变量相关性较强的变量,降低了算法的效率和数据处理分析的准确性的问题,具有有利于距离的计算、保证了旋转、缩放、平移的不变性、能够对手写字体图像进行有效处理、去除不相干变量,突出几个隐含变量的有益技术效果。
技术领域
本发明属于图像处理与识别技术领域,尤其涉及一种基于距离优化降维的手写字体识别系统。
背景技术
数据降维是针对高维数据处理问题提出的有效解决办法。在实际数据采集的过程中,一个观察对象往往需要用多个变量表示,这些信息抽象出来便成为了高维数据,如图像处理中,人像、位姿、字体等图像对应的高维数据。现有的数据挖掘、处理手段往往对低维数据有效,高维数据由于经常包含大量冗余信息,例如对结果影响较小的变量、与其他变量相关性较强的变量,降低了算法的效率和数据处理分析的准确性,如何把数据的维数降低到一个合理的大小,把高维数据变成低维数据,同时尽可能保留原始数据的关键信息,是对手写字体图像进行有效识别的关键,现有技术存在数据挖掘、处理手段往往对低维数据有效,高维数据由于经常包含大量冗余信息、对结果影响较小的变量、与其他变量相关性较强的变量,降低了算法的效率和数据处理分析的准确性的问题。
发明内容
本发明提供一种基于距离优化降维的手写字体识别系统,以解决上述背景技术中提出存在数据挖掘、处理手段往往对低维数据有效,高维数据由于经常包含大量冗余信息、对结果影响较小的变量、与其他变量相关性较强的变量,降低了算法的效率和数据处理分析的准确性的问题。
本发明所解决的技术问题采用以下技术方案来实现:一种基于距离优化降维的手写字体识别系统,包括手写字体库、手写字体识别平台、手写字体输出模块,所述手写字体识别平台包括:查找模块、重建模块、嵌入模块;
所述查找模块用于确定每个样本点的个近邻点;
所述确定每个样本点的个近邻点包括:
第一步骤:计算低维度距离矩阵的距离元素:
所述xi为第一样本点,所述第一样本点为样本矩阵中任一样本点;
所述xj为第二样本点,所述第二样本点为样本矩阵中除第一样本点外另一样本点;
所述M(i)为第一样本点与样本库其余样本点之间距离的平均值;
所述M(j)为第二样本点与样本库其余样本点之间距离的平均值;
所述为第一样本点和第二样本点之间的距离;
第二步骤:根据距离元素确定样本点相应的K个近邻点,所述K为预设定值;
所述重建模块用于根据每个样本点的近邻点计算出该样本点的局部重建权值矩阵;
计算出该样本点的局部重建权值矩阵包括:
第三步骤:建立局部协方差矩阵:
Zjm=(xi-xij)T(xi-xim)
所述Zjm为样本点xi的局部协方差矩阵;
所述xij为样本点xi的K个近邻点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于毅康科技有限公司,未经毅康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610048955.3/2.html,转载请声明来源钻瓜专利网。