[发明专利]一种科学公式正确性检验方法和装置在审
申请号: | 201911360663.3 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111046637A | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 张翔 | 申请(专利权)人: | 小船出海教育科技(北京)有限公司 |
主分类号: | G06F40/154 | 分类号: | G06F40/154;G06F40/14 |
代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 科学 公式 正确性 检验 方法 装置 | ||
本发明提供了一种科学公式正确性检验方法和装置,所述科学公式正确性检验方法获取并识别科学公式,根据科学公式初始数据格式转换为目标数据格式;判断科学公式是否已经被录入、审核过,如果当前公式未被录入且审核过,则核对初始数据格式所表示的内容与目标数据格式所表示的内容是否一致。块。所述方法以MathML格式数据为核心,利用MathML的标记式结构解决了当前科学公式数据在Windows、Linux和Mac OS操作系统之间跨平台转换过程中易出现错误的问题,同时还可以对已经在纠错模块中进行完纠错的科学公式数据进行保存,对已输入并经过校对的科学公式素材进行重复使用。
技术领域
本发明涉及电子文档编辑出版领域,尤其涉及一种科学公式正确性检验方法和装置。
背景技术
在出版物领域,尤其是教材出版领域中,各种科学公式的素材是必不可少的。随着信息化的不断推进,电子化出版和教学工具不断的发展演进,导致各种录入科学公式的软件以及文档格式不断增多。在当前的出版行业中,在编辑科学公式环节中,使用的软件主要有Word、MathType等;而在印刷环节中,以Tex软件为主。由于应用场景不同,其录入的科学公式的数据格式不同,不同的数据格式又不是100%的相互兼容、个别国外录入软件运行时还需要特殊干预。为充分地利用现有的不同数据格式的科学公式,避免重复劳动,需要一个可实现不同平台、不同软件录入的科学公式相互正确转换的方法。
发明内容
鉴于上述原因,本发明的目的是提供一种科学公式正确性检验方法。该方法以MathML格式数据为核心,兼容不同录入平台和录入软件,实现不同平台和软件之间科学公式的正确转换。
为实现上述目的,本发明采用以下技术方案:一种科学公式正确性检验方法法,它包括如下步骤:
获取并识别科学公式,根据科学公式初始数据格式转换为目标数据格式;
判断科学公式是否已经被录入、审核过,如果当前公式未被录入且审核过,则核对初始数据格式所表示的内容与目标数据格式所表示的内容是否一致。
进一步地,所述“核对初始数据格式所表示的内容与目标数据格式所表示的内容是否一致”包括:
将初始数据格式、目标数据格式渲染为图片;或者,将初始数据格式和/或目标数据格式转换为第三数据格式,由第三数据格式渲染成图片;
将图片中的内容转换为文本;
对比图片转换后的文本差异值,判断差异值是否处于设置的判断结果区间。
进一步地,所述“渲染成图片”之前还包括:判断图片渲染结果,如渲染成功,则将图片中的内容转换为文本。
进一步地,所述“渲染成图片”包括:获取待审核公式格式的矢量图,将所述矢量图转换为RGB通道的图片;
优选地,所述“获取待审核公式格式的矢量图”包括:SVG数据公式格式转为RGB通道图片,将SVG图像转换为PDF,再将PDF转换为图片。
进一步地,所述“将图片中的内容转换为文本”包括:采用OCR识别将图片中的内容转换为文本。
进一步地,所述“对比图片转换后的文本差异值”包括使用最小编辑距离算法进行对比;
优选地,如核对结果为内容不一致时,进行人工纠错。
进一步地,所述“根据科学公式初始数据格式转换为目标数据格式”包括:
获取待转换科学公式的初始数据格式和目标数据格式,对待转换公式进行解析,验证内容的合法性;
根据目标数据格式,进行格式转换;
对转换后的公式数据进行格式化,生产统一标准的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于小船出海教育科技(北京)有限公司,未经小船出海教育科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911360663.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网络工程用多人即时通讯系统
- 下一篇:修复假体及具有其的胫骨结构