[发明专利]面向专利领域的文档检索方法有效
| 申请号: | 200810012248.4 | 申请日: | 2008-07-09 |
| 公开(公告)号: | CN101625680A | 公开(公告)日: | 2010-01-13 |
| 发明(设计)人: | 朱靖波;王会珍;曹菲菲;肖桐;李天宁;宋国龙 | 申请(专利权)人: | 东北大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 沈阳科苑专利商标代理有限公司 | 代理人: | 许宗富;周秀梅 |
| 地址: | 110004辽宁省*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 面向 专利 领域 文档 检索 方法 | ||
1.一种面向专利领域的文档检索方法,包括以下步骤:
对查询文本和专利文本进行预处理;
检索与查询文本相关的专利文本,采用多种不同相似度计算的方法得 到不同相似度的值,组合不同相似度的值,重新计算相似度,按新的相似 度的值对专利文本排序;
采用多种不同的决策方法,将专利文本的相似度排序映射成为专利类 别相关性的不同排序;对多个不同专利类别相关性排序结果进行整合,重 新排序得到新的专利类别相关性排序;
从新的专利类别相关性排序中,选择与查询文本最相关的专利类别;
所述多种不同相似度的计算方法得到查询文本与专利文本的相似度 值,基于对数线性模型整合上述多种不同的相似度值,计算公式如下:
其中,是查询文本和专利文本采用不同相似度计算方法得 到的相似度值作为特征组成的向量,是采用不同相似度计算方法得到的相 似度值的权重向量,n是与查询文本相关的专利文本总数,表示第k个相 关的专利文本向量;
所述多种不同的决策方法,包括专利类别权重的相似度加和方法、专 利文本相似度排序位置权重的相似度加和方法以及专利文本相似度加和方 法,其中专利类别权重的相似度加和计算公式如下:
其中,kr是惩罚因子常数,k表示专利文本相似度排序结果中的候选的 专利文本个数,ci是指候选专利文本i所属的专利类别按照相似度排序得到 的位置,是查询文本与专利文本di的相似度值,ICF是指类别文本频 度的倒数,其中Cx是指类别x下的文本数,N总的文本数,score(x)为查询 文本与专利类别x的相关性的值,role(x,i)判断专利文本di是否属于专利类 别X;
所述专利文本相似度排序位置权重的相似度加和计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810012248.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:职称评定手持无线表决器
- 下一篇:一种声波控制密码电子锁系统





