[发明专利]一种基于纵横直方图的字体识别方法有效
| 申请号: | 201811050868.7 | 申请日: | 2018-09-10 |
| 公开(公告)号: | CN109460701B | 公开(公告)日: | 2020-09-25 |
| 发明(设计)人: | 龙华;祁俊辉;邵玉斌;杜庆治 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 纵横 直方图 字体 识别 方法 | ||
本发明涉及一种基于纵横直方图的字体识别方法,属于字体识别技术领域。本发明通过收集TTC字体文件,从中提取字符的纵向特征向量及横向特征向量,建立字体特征数据库,由用户上传单个字符的图像形式信息及对应的字符文字信息,利用现代切割技术及字符形状特征,对图像进行特定的灰度化、二值化处理后提取字符特征并生成纵向特征向量及横向特征向量,与数据库中所有字符为用户输入的字符文字信息的数据分别计算其基于纵向直方图的字体识别度及基于横向直方图的字体识别度,通过融合算法计算最终字体识别度,最后通过排序输出识别度最高的字体集合。本发明解决了现有技术对字体进行识别时存在的准确性欠佳及人机交互不灵活等现象。
技术领域
本发明涉及一种基于纵横直方图的字体识别方法,属于字体识别技术领域。
背景技术
字体是工作中极为常用的东西,无论使用何种文档编辑器,字体是一定要用的东西。字体就是“到用时,方恨少”,在日常生活中,浏览各类网站时往往都会遇到很多有意思的字体,但因为不知道其为何种字体,便与之交错。
目前,互联网上已经有一些识别字体的网站供人们使用,其流程通常先由用户上传所要识别的字符图像,并指出该字符图像所对应的字符信息,接着通过内定的识别算法对其识别并输出,但其中的准确度并不理想。简单地说,就是其中所使用的字体识别算法的准确度不高。
发明内容
本发明要解决的技术问题是提供一种基于纵横直方图的字体识别方法,以解决现有技术对字体进行识别时存在的准确性欠佳及人机交互不灵活等现象,致力于增加目前依靠计算机对字体进行识别的准确性与灵活性。
本发明的技术方案是:一种基于纵横直方图的字体识别方法,该方法具体包括以下步骤:
Step0:采集字体文件及字符图像,对图像进行预处理,并创建字体特征数据库;具体实施步骤如Step0.1~Step0.5所示;
Step0.1:收集TTC字体文件,其TTC字体文件包括但不限于宋体、黑体、微软雅黑,记TTC字体文件数量为K;
Step0.2:从TTC字体文件中提取出每个字符所对应的图像,即字符图像大小为l×w,单位为像素点;将字符图像作为输入源,生成该字符所对应的字符矩阵Il×w,该矩阵中的元素值即为该像素点的灰度值;定义ξ为灰度二值化阈值,对矩阵Il×w进行公式(1)所示二值化处理,得到二值化矩阵I′l×w,其中I′(i,j)为元素值;
Step0.3:将二值化矩阵I′l×w进行公式(2)所示纵向叠加处理,生成纵向特征向量{z1,z2,…,zi,…,zl};
Step0.4:将二值化矩阵I′l×w进行公式(3)所示横向叠加处理,生成横向特征向量{h1,h2,…,hj,…,hw};
Step0.5:将所有字符以及所对应的纵向特征向量{z1,z2,…,zi,…,zl}、横向特征向量{h1,h2,…,hj,…,hw}字体信息等存入数据库,组建字体特征数据库;
Step1:由用户上传单个字符的图像形式信息X,并指出该字符所对应的待测字符X′;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811050868.7/2.html,转载请声明来源钻瓜专利网。





