[发明专利]图片内文字显示方法及装置有效
申请号: | 201310403351.2 | 申请日: | 2013-09-06 |
公开(公告)号: | CN103500332B | 公开(公告)日: | 2017-03-15 |
发明(设计)人: | 梁捷;俞永福;谭柱成;李会民 | 申请(专利权)人: | 优视科技有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙)11363 | 代理人: | 陈蕾,许伟群 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 文字 显示 方法 装置 | ||
1.一种图片内文字显示方法,其特征在于,所述方法包括:
获取待识别图片;
根据待识别图片上的连通体判断所述待识别图片内是否存在至少一行汉字;
当所述待识别图片内存在至少一行汉字时,对待识别图片内一行汉字中的连通体依次进行横向区域分割,得到待识别汉字,所述待识别汉字内包含有一个或多个连通体;
根据所述待识别汉字内包含连通体的个数,在预先建立的样本字库内查找满足匹配度要求的汉字,将查找到汉字作为目标汉字;
显示所有目标汉字。
2.根据权利要求1所述的方法,其特征在于,判断所述待识别图片内是否存在至少一行汉字,包括:
对待识别图片进行图像处理;
对图像处理后的待识别图片进行连通性分析,得到多个组成汉字的连通体;
判断在待识别图片内连通体所在位置是否存在至少一组字符基线;
当存在至少一组字符基线时,确定所述待识别图片内存在至少一行汉字;
当不存在字符基线时,确定所述待识别图片内不存在至少一行汉字。
3.根据权利要求1或2所述的方法,其特征在于,所述对待识别图片内一行汉字中的连通体依次进行横向区域分割,包括:
在一行汉字中依次选取一个连通体加入到待识别连通体组内;
计算所述待识别连通体组的外围矩形的宽高比例;
判断所述连通体组的外围距离的宽高比例是否小于预先设置的比例阈值;
当所述连通体组的外围距离的宽高比例小于比例阈值时,依次选取一个相邻连通体增加到所述待识别连通体组,计算并判断增加连通体后待识别连通体组的外围矩形的宽高比例是否小于预先设置的比例阈值;
当增加连通体后待识别连通体组的外围矩形的宽高比例大于等于预先设置的比例阈值时,将增加连通体前的待识别连通体内所有连通体作为一个待识别汉字。
4.根据权利要求3所述的方法,其特征在于,所述对待识别图片内一行汉字中的连通体依次进行横向区域分割,还包括:
计算待识别汉字的宽高比例与预先设置的比例阈值的均值;
判断所述均值是否在预先设置的数值区间内;
当所述均值位于预先设置的数值区间内,将所述均值替换预先设置的比例阈值;
当所述均值位于预先设置的数值区间外,继续使用预先设置的比例阈值。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
判断所选取一行汉字中是否存在新的连通体,当不存在新的连通体时,结束。
6.根据权利要求1所述的方法,其特征在于,所述在预先建立的样本字库内查找满足匹配度要求的汉字,包括:
在预先建立的样本字库内查找连通体个数与所述待识别汉字内包含连通体的个数相同的汉字,作为待选汉字;
计算所述待识别汉字与待选汉字的匹配度;
判断所述待识别汉字与待选汉字的匹配度是否大于等于预先设置的匹配度阈值;
当所述待识别汉字与待选汉字的匹配度大于等于匹配度阈值时,将匹配度最大的待选汉字确定为目标汉字。
7.根据权利要求6所述的方法,其特征在于,当查找到的所有待选汉字的匹配度都小于匹配度阈值时,所述在预先建立的样本字库内查找满足匹配度要求的汉字,还包括:
在预先建立的样本字库内查找连通体个数与所述待识别汉字内包含连通体的个数相差n的汉字,作为备选汉字,n的初始值为0;
计算所述待识别汉字与备选汉字的匹配度;
判断所述待识别汉字与待选汉字的匹配度是否大于等于预先设置的匹配度阈值;
当所述待识别汉字与备选汉字的匹配度大于等于匹配度阈值时,将匹配度最大的备选汉字确定为目标汉字;
当所述待识别汉字与备选汉字的匹配度小于匹配度阈值时,将n的值增加1后,继续查找备选汉字,直至n等于预先设置的循环次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于优视科技有限公司,未经优视科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310403351.2/1.html,转载请声明来源钻瓜专利网。