[发明专利]数学公式相似度的测量方法及其测量系统有效
申请号: | 201711342621.8 | 申请日: | 2017-12-14 |
公开(公告)号: | CN109918473B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 颜钦钦;高良才;汤帜 | 申请(专利权)人: | 北大方正集团有限公司;北大方正信息产业集团有限公司;北京大学 |
主分类号: | G06F16/33 | 分类号: | G06F16/33 |
代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰;汪海屏 |
地址: | 100871 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数学公式 相似 测量方法 及其 测量 系统 | ||
本发明提出了一种数学公式相似度的测量方法及其测量系统,其中数学公式相似度的测量方法包括:将待测量数学公式和基准数学公式分别表示为待测量链表树和基准链表树;计算待测量链表树及基准链表树的相似度,得到第一数值;判断第一数值是否小于1;当第一数值小于1时,计算待测量链表树的子结构与基准链表树的子结构的相似度,得到第二数值;比较第一数值及第二数值的大小,将第一数值与第二数值中较大的一个作为待测量数学公式和基准数学公式的相似度测量结果。本发明提供的数学公式相似度的测量方法相比较于以往基于文本相似的测量方式,具有更好的可信度。
技术领域
本发明涉及信息检索领域,具体而言,涉及一种数学公式相似度的测量方法、数学公式相似度的测量方法的测量系统、一种计算机设备及计算机可读存储介质。
背景技术
随着对数字化信息资源的研究不断深入,应用的层次越来越细化。以数字文档资源和网络知识库为基础的识别和检索系统,不仅需要提供浏览书籍、刊物等基本功能,还需要提供对文档内部对象的编辑加工等高级功能。这就要求系统对文档内部章节、段落等文本对象和对图表、公式等特殊对象进行定义、描述、度量以支撑功能应用。
数学公式的相似度测量方法是描述两个数学公式之间相似程度的一种度量,是系统的必要组成部分。例如:在公式识别中,可以理解为识别结果与基准结果的逼近程度;在公式检索中,可用于检索对象与检索结果序列在语义上的符合程度排序等等;所以,对数学公式的相似度度量,日益成为一个重要的研究热点。
现有的数学公式相似度测量方法,一般由文本的相似度度量方法演化而来,除了对形态完全一样的数学公式可做准确度量,其余结构部分匹配、语义部分匹配的情形均无良好的度量。
文献“数学公式的采集、组织和检索”中采用ontology工具来描述数学表达式的运算关系、运算、运算因子、目标函数和边界符等特征项框架,将抽象的特征项构成一个向量空间,然后用底层的模板库实现匹配度量。这种方法依赖于向量空间的构成,针对较为复杂的数学公式,要把所有的数学特征全部表示出来也是一个比较繁琐的工作,实现难度较大。
文献“EMERS:a tree matching-based performance evaluationofmathematicalexpression recognition systems”中采用树结构的方式表示公式,通过引入欧拉字符串的定义,将数学公式转化为一维字符串表示,然后使用字符串的编辑距离进行度量。这种方法稀释了数学公式的语义和结构信息,置信度较低。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。
为此,本发明第一方面提出了一种数学公式相似度的测量方法。
本发明第二方面提出了一种数学公式相似度的测量方法的测量系统。
本发明第三方面提出了一种计算机设备。
本发明第四方面提出了一种计算机可读存储介质。
有鉴于此,本发明第一方面提出了一种数学公式相似度的测量方法,包括:将待测量数学公式和基准数学公式分别表示为待测量链表树和基准链表树;计算待测量链表树及基准链表树的相似度,得到第一数值;判断第一数值是否小于1;当第一数值小于1时,计算待测量链表树的子结构与基准链表树的子结构的相似度,得到第二数值;比较第一数值及第二数值的大小,将第一数值与第二数值中较大的一个作为待测量数学公式和基准数学公式的相似度测量结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北大方正集团有限公司;北大方正信息产业集团有限公司;北京大学,未经北大方正集团有限公司;北大方正信息产业集团有限公司;北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711342621.8/2.html,转载请声明来源钻瓜专利网。