[发明专利]一种数学公式识别方法、装置在审
申请号: | 202310509754.9 | 申请日: | 2023-05-08 |
公开(公告)号: | CN116469117A | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 谢卫军;李博;刘瑾 | 申请(专利权)人: | 湖南民族职业学院 |
主分类号: | G06V30/40 | 分类号: | G06V30/40;G06V30/30;G06V30/18;G06V30/19;G06N3/0464;G06N3/08 |
代理公司: | 西安合创非凡知识产权代理事务所(普通合伙) 61248 | 代理人: | 杨蕾 |
地址: | 414000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数学公式 识别 方法 装置 | ||
本发明提供一种数学公式识别方法、装置,涉及识别技术领域。该数学公式识别方法,具体包括以下步骤:S1.公式编存,将已知公式进行汇总,并构建公式组合模型进行存储定义;S2.获取图像信息,接收待识别文本图像,包括外接载入和实时获取。通过在识别过程中充分利用了数学公式的结构性质,降低了字符识别的难度,优化了整个识别过程的效果和流程,提升了对文本图像数学公式识别的精确性和识别速度,为用户提供更加精准、简便、快捷的数学公式输入体验,同时利用提取的文本图像特征描述了当前字符前后括号的匹配情况,从而可以有效地避免字符的歧义及前后括号不匹配的情况,且识别过程考虑了字符间的时序性,提升了歧义字符的识别准确度。
技术领域
本发明涉及识别技术领域,具体为一种数学公式识别方法、装置。
背景技术
数学公式用于表征自然界不同事物之数量之间的或等或不等的联系,常用于教材、科技论文等文档中。与一维结构的文本行不同,数学公式中通常存在上下、左右、包围等二维结构,在科研教育领域,很多科研文献中的印刷体数学公式以图片的形式存在。
现有方法在进行文本解析时,一般不单独对数学公式进行识别,而是直接将公式字符作为普通字符进行处理,由于数学公式复杂的结构极大地增加了计算机识别的难度,且手写文本图像的非精确性、书写笔体和速度、数学符号的二义性、结构的多变性等都给数学公式的识别和编辑进一步增加了难度,经常会出现对字符的识别错误,并且会将对字符的错识问题叠加到对整个数学公式的分析中,从而影响最终的数学公式识别结果,导致识别数学公式不准确。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种数学公式识别方法、装置,解决了传统方法直接将公式字符作为普通字符进行处理,由于数学公式复杂的结构,经常会出现对字符的识别错误,并且将对字符的识别错误叠加到对整个数学公式的分析中,从而影响最终的数学公式识别结果,导致识别数学公式不准确的问题。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种数学公式识别方法,具体包括以下步骤:
S1.公式编存
将已知公式进行汇总,并构建公式组合模型进行存储定义;
S2.获取图像信息
接收待识别文本图像,包括外接载入和实时获取;
S3.图像处理
使用双线性卷积神经网络模型对图像进行高层语义特征获取,通过迭代训练网络模型中的卷积参数,过滤图像中不相关的背景信息,根据不同的卷积参数采用不同的频数系数分类处理;
S4.非盲去模糊
获取多组同区域聚焦文本图像,收集同种目标物并去除孤立且明亮的像素点,随后进行目标区域的扩大并进行最大值滤波,通过增强放大目标的能量强度以及尺寸,同时去除图像中大部分盲元;
S5.目标提取
根据S2-S4步骤后确定获取的图像像素大小,并对图像进行图像文本提取,对所采集到的图像文本中的目标物进行确定,将提取点分别聚焦于各个目标物上,生成多张聚焦图像,采用增强差分演化方法,求取每张多聚焦图像的最佳分块大小,并将每张多聚焦图像中目标物部分进行标记提取;
S6.糅合对齐与归类
将S5中完成文本图像特征提取的文本进行按序排列组合,并对非公式字符进行隐藏处理,利用数据库存储的公式特征数据与即时提取的文本图像特征数据进行特征匹配,筛选出对应的公式组合,并将筛选出的公式组合与即时提取的文本图像特征数据通过图像特征进行图像对齐;
S7.识别归类
通过基于孪生网络的图像相似度比较判别一致性,未对齐的文本字符直接视作检测不一致区域,标记为超阈区域,其余视作一致文本行图像,标记处的超阈区域基于图像结构化相似度检测比较一致性,像素有区别的图像生成后依次进行二值化、去噪和轮廓检测,通过最小外接矩形标出不一致区域;
S8.结果判定
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南民族职业学院,未经湖南民族职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310509754.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型浴室柜
- 下一篇:一种瓦楞纸箱生产用纸浆混合装置