[发明专利]文字检测方法和装置有效
申请号: | 201510970839.2 | 申请日: | 2015-12-22 |
公开(公告)号: | CN105574513B | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 姚聪;周舒畅;周昕宇;印奇 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/72 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙)11481 | 代理人: | 徐丁峰,张玮 |
地址: | 100190 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文字 检测 方法 装置 | ||
1.一种文字检测方法,包括:
接收多个样本图像和所述样本图像的标注信息;
根据所述样本图像和所述样本图像的标注信息生成所述样本图像的掩膜图;
利用所述样本图像和所述掩膜图训练神经网络,以获得语义预测模型;
接收待检测图像;
经由所述语义预测模型生成所述待检测图像的全图的文字区域概率图,其中,所述文字区域概率图使用不同的像素值区分所述待检测图像的文字区域和所述待检测图像的非文字区域;以及
对所述文字区域概率图进行分割操作,以确定所述文字区域。
2.如权利要求1所述的方法,还包括:
接收原始图像;以及
对所述原始图像进行预处理,以获得所述待检测图像,
其中,所述待检测图像具有预设尺寸大小,并且所述待检测图像的长宽比例与所述原始图像的长宽比例相同。
3.权利要求1所述的方法,其中,对所述文字区域概率图进行分割操作,以确定所述文字区域包括:
对所述文字区域概率图进行二值化操作,以确定所述文字区域。
4.如权利要求3所述的方法,其中,对所述文字区域概率图进行二值化操作,以确定所述文字区域包括:
确定所述二值化操作所获得的每个连通区域的轮廓;以及
将所述轮廓拟合为四边形,其中,所述四边形内部区域为所述文字区域。
5.如权利要求1所述的方法,其中,所述掩膜图包括二值掩膜图,并且所述二值掩膜图使用不同的像素值区分所述样本图像的文字区域和非文字区域。
6.如权利要求1所述的方法,其中,所述神经网络包括全卷积神经网络。
7.如权利要求6所述的方法,其中,所述全卷积神经网络的层数包括6到19之间的任意数。
8.如权利要求1至7任一项所述的方法,其中,所述语义预测模型用于根据所述待检测图像的语义预测所述待检测图像中的像素属于文字区域还是属于非文字区域。
9.一种文字检测装置,包括:
训练模块,用于接收多个样本图像和所述样本图像的标注信息,根据所述样本图像和所述样本图像的标注信息生成所述样本图像的掩膜图,以及利用所述样本图像和所述掩膜图训练神经网络,以获得语义预测模型;
语义分析模块,连接至所述训练模块,用于接收待检测图像,并使用所述语义预测模型以生成所述待检测图像的全图的文字区域概率图,其中,所述文字区域概率图使用不同的像素值区分所述待检测图像的文字区域和所述待检测图像的非文字区域;以及
分割模块,用于对所述文字区域概率图进行分割操作,以确定所述文字区域。
10.如权利要求9所述的文字检测装置,所述装置进一步包括:
图像预处理模块,用于接收原始图像,并对所述原始图像进行预处理,以获得所述待检测图像,
其中,所述待检测图像具有预设尺寸大小,并且所述待检测图像的长宽比例与所述原始图像的长宽比例相同。
11.权利要求9所述的文字检测装置,其中,所述分割模块进一步用于对所述文字区域概率图进行二值化操作,以确定所述文字区域。
12.如权利要求11所述的文字检测装置,其中,所述分割模块进一步用于确定所述二值化操作所获得的每个连通区域的轮廓,并将所述轮廓拟合为四边形,其中,所述四边形内部区域为所述文字区域。
13.如权利要求9所述的文字检测装置,其中,所述掩膜图包括二值掩膜图,并且所述二值掩膜图使用不同的像素值区分所述样本图像的文字区域和非文字区域。
14.如权利要求9所述的文字检测装置,其中,所述神经网络包括全卷积神经网络。
15.如权利要求14所述的文字检测装置,其中,所述全卷积神经网络的层数包括6到19之间的任意数。
16.如权利要求9至15任一项所述的文字检测装置,其中,语义预测模型用于根据所述待检测图像的语义预测所述待检测图像中的像素属于文字区域还是属于非文字区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510970839.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于多相互斥水平集的黏连细胞图像分割方法
- 下一篇:图像处理的方法和装置