[发明专利]一种基于深度学习的医用胶片上文字信息的识别方法在审
申请号: | 202110661076.9 | 申请日: | 2021-06-15 |
公开(公告)号: | CN113392844A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 黄志伟;林金朝;庞宇;王慧倩;杨宏志 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06N3/04;G06N3/08 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 医用 胶片 文字 信息 识别 方法 | ||
1.一种基于深度学习的医用胶片上文字信息的识别方法,其特征在于,该方法具体包括以下步骤:
S1:将待识别文字信息的胶片图像输入到特征提取网络,获取含有文字多尺度的特征图;
S2:将步骤S1获取的特征图输入到多方向窗口提取网络中,得到建议框;
S3:利用改进的建议框旋转模块处理步骤S2的建议框,得到文本检测结果;
S4:将步骤S3的文本检测结果输入到编解码文字识别模块中,得到胶片上对应的文字识别结果。
2.根据权利要求1所述的医用胶片上文字信息的识别方法,其特征在于,步骤S1中,利用特征提取网络获取含有文字多尺度的特征图的具体步骤为:首先通过两层卷积操作提取简单的特征图,然后将特征图中的特征向量输入到金字塔循环网络,通过循环卷积不断提取文字的高层语义信息和底层边界定位信息,将金字塔网络提取的特征输入到Def-Incept模块,利用可变形卷积提取医用胶片中不规则形状的文字特征,最后将多层特征融合,生成含有文字多尺度特征的特征图。
3.根据权利要求1所述的医用胶片上文字信息的识别方法,其特征在于,步骤S2中,利用多方向窗口提取网络得到建议框的具体步骤为:首先在步骤S1的特征图上的每个特征点生成多个不同长宽比的锚框,然后通过不同尺寸的锚框获得对应原始感受野的候选锚框,最后通过候选锚框的坐标修正和得分排序,选择得分高的候选锚框作为建议框。
4.根据权利要求1所述的医用胶片上文字信息的识别方法,其特征在于,步骤S3中,利用改进的建议框旋转模块得到文本检测结果的具体步骤为:对步骤S2的建议框旋转一定角度,得到倾斜的文本建议框,然后将这些文本建议框与训练集标注的真实标签进行交并比IOU重合度计算,最后通过Fast RCNN模块对建议框筛选,采用非极大值抑制方法选择得分最高的建议框作为文本检测结果。
5.根据权利要求1所述的医用胶片上文字信息的识别方法,其特征在于,步骤S4中,利用编解码文字识别模块得到胶片上对应的文字识别结果的具体步骤为:采用基于密集连接网络和两层BLSTM的方法提取文字特征,生成具备字符上下文特征关系的特征向量序列,并采用注意力机制对编码的特征向量进行加权,更准确地利用字符相关信息,最后通过一层LSTM,利用前一时刻的输出和当前时刻的输入共同决定当前时刻的文字识别结果;最终输出胶片对应的文字识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110661076.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种贱金属溶液中分离回收镉的方法
- 下一篇:一种单基站室内定位系统及定位方法