[发明专利]一种文本检测方法及系统有效
申请号: | 202110262754.4 | 申请日: | 2021-03-11 |
公开(公告)号: | CN112966678B | 公开(公告)日: | 2023-01-24 |
发明(设计)人: | 江少锋;杨素华;陈震;张聪炫 | 申请(专利权)人: | 南昌航空大学 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/26;G06V10/28;G06V10/774;G06V30/10;G06V30/14;G06V30/162;G06V30/19 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 刘凤玲 |
地址: | 330000 江*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 检测 方法 系统 | ||
1.一种文本检测方法,其特征在于,包括:训练阶段和检测阶段;
所述训练阶段的步骤包括:
获取待训练图像;
对待训练图像进行二值化处理;
二值化处理的方式为:
当f(i,j)=1时像素点(i,j)点为黑点,当f(i,j)=0时像素点(i,j)点为白点;i和j分别为像素点(i,j)的横纵坐标;
对二值化处理后的待训练图像进行垂直投影处理并利用垂直投影中的空白间隙完成文字的分割,得到待训练标签数据;
垂直投影值的计算公式为:
垂直投影方式为对二值化图像从左往右逐列进行扫描,同时计算每个扫描列的像素,以获取图像的垂直投影;垂直投影后根据垂直投影值确定文字位置;利用文字间空白间隔造成的垂直投影空白间隙,使各个文字分割开来,获得单字小碎框待训练标签数据;
对待训练标签数据按照每n个一组的方式进行组合;
将组合后的待训练标签数据输入文本检测模型中进行训练,得到经训练文本检测模型;
所述检测阶段的步骤包括:
获取待测文本图像;
将所述待测文本图像输入所述经训练文本检测模型中生成包含检测结果的文本检测框;
所述文本检测模型为改进型yolov5模型;
所述改进型yolov5模型为在yolov5网络模型的第7个CBL组件后增加一个上采样组件,将第7个CBL组件获取到的大小为76*76的特征图经上采样组件后扩大为152*152大小,并与网络第2层输出相融合,获取到大小为152*152的检测层所形成的模型;
在所述将所述待测文本图像输入所述经训练文本检测模型中生成包含检测结果的文本检测框之后,还包括:
对相邻的文本检测框进行连接组合并对独立的文本检测框进行复查;
所述对相邻的文本检测框进行连接组合并对独立的文本检测框进行复查,具体包括:
将相距小于预设阈值的文本检测框进行区域连接形成大区域文本检测框;
判断各独立的文本检测框的中心是否位于任意一个所述大区域文本检测框的内部,得到第一判断结果;
若所述第一判断结果表示独立的文本检测框的中心位于其中一个所述大区域文本检测框的内部,则将所述独立的文本检测框合并到所处的大区域文本检测框中;
若所述第一判断结果表示独立的文本检测框的中心位于所有的大区域文本检测框的外部,则保留所述独立的文本检测框。
2.一种文本检测系统,其特征在于,包括:
训练模块和检测模块;
所述训练模块包括:
待训练图像获取单元,用于获取待训练图像;
对待训练图像进行二值化处理;
二值化处理的方式为:
当f(i,j)=1时像素点(i,j)点为黑点,当f(i,j)=0时像素点(i,j)点为白点;i和j分别为像素点(i,j)的横纵坐标;
对二值化处理后的待训练图像进行垂直投影处理并利用垂直投影中的空白间隙完成文字的分割,得到待训练标签数据;
垂直投影值的计算公式为:
垂直投影方式为对二值化图像从左往右逐列进行扫描,同时计算每个扫描列的像素,以获取图像的垂直投影;垂直投影后根据垂直投影值确定文字位置;利用文字间空白间隔造成的垂直投影空白间隙,使各个文字分割开来,获得单字小碎框待训练标签数据;
对待训练标签数据按照每n个一组的方式进行组合;
将组合后的待训练标签数据输入文本检测模型中进行训练,得到经训练文本检测模型;
所述检测模块包括:
待测文本图像获取单元,用于获取待测文本图像;
文本检测单元,用于将所述待测文本图像输入所述经训练文本检测模型中生成包含检测结果的文本检测框;
所述文本检测模型为改进型yolov5模型;
所述改进型yolov5模型为在yolov5网络模型的第7个CBL组件后增加一个上采样组件,将第7个CBL组件获取到的大小为76*76的特征图经上采样组件后扩大为152*152大小,并与网络第2层输出相融合,获取到大小为152*152的检测层所形成的模型;
所述的文本检测系统,还包括:连接与复查模块,所述连接与复查模块与所述检测模块连接;
所述连接与复查模块用于对相邻的文本检测框进行连接组合并对独立的文本检测框进行复查;
所述连接与复查模块包括:
相邻连接单元,用于将相距小于预设阈值的文本检测框进行区域连接形成大区域文本检测框;
判断处理单元,用于判断各独立的文本检测框的中心是否位于任意一个所述大区域文本检测框的内部,得到第一判断结果;若所述第一判断结果表示独立的文本检测框的中心位于其中一个所述大区域文本检测框的内部,则将所述独立的文本检测框合并到所处的大区域文本检测框中;若所述第一判断结果表示独立的文本检测框的中心位于所有的大区域文本检测框的外部,则保留所述独立的文本检测框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌航空大学,未经南昌航空大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110262754.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防晒护肤化妆乳液
- 下一篇:从非结构化数据中提取结构化数据方法及装置