[发明专利]面向专利领域的文档检索方法有效
申请号: | 200810012248.4 | 申请日: | 2008-07-09 |
公开(公告)号: | CN101625680A | 公开(公告)日: | 2010-01-13 |
发明(设计)人: | 朱靖波;王会珍;曹菲菲;肖桐;李天宁;宋国龙 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 沈阳科苑专利商标代理有限公司 | 代理人: | 许宗富;周秀梅 |
地址: | 110004辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 专利 领域 文档 检索 方法 | ||
技术领域
本发明涉及一种资料检索方法,特别是一种面向专利领域的文档检索 方法。
背景技术
科学技术的迅速发展,记录科技成果的文献大量增长,专利作为知识 产权保护最重要的手段之一越来越被重视。专利文本记载最新颖的发明创 造所涉及的技术方案,然而记载科技成果的文献,除了专利,还有其它非 专利文本,例如科研论文、技术报告等。专利与非专利之间存在一定的关 系,例如,对科研论文与专利关系的研究,可以预测技术发展趋向。对专 利文献和非专利的科研文献的研究,可以了解各个领域最新的技术,从而 避免重复开发,避免侵权,甚至可以分析整个技术行业的发展;可以分析 竞争者的技术研发状况以及策略;可以实现对专利的无效性检索。对专利 文献和非专利文献的检索是专利研究领域较新的课题。
专利文本中通常会有引用相关的专利或者是科研论文,单纯利用专利 与科研论文的引用关系研究非专利文献与专利文本之间的关系,非常有限。 而且,专利数据库中的专利文档有几百万之多,单纯采用人工方式的专利 操作是一项费时费力的工作。如何从庞大的专利数据库中检索到相关专利 并获取有用的专利信息是专利研究的一个难题。
目前的专利检索和分类方法有两种,一种是基于专利数据库对已经分 类的专利检索,另一种基于自然语言处理技术的检索方法。
早期专利检索方法大多数基于专利数据库的方法,例如公开号为CN 1996290A专利,主要利用了专利结构化的文本信息,抽取专利引证关系, 构建专利关联图。然后根据一定的专利查询条件,例如申请号、专利号、 申请日期、公告日期、发明人、专利权人等,在专利关联图中检索专利并 将检索到的专利。这种方法依赖于专利本身固定的结构化文本,不够智能 化,没有对专利内容进行分析。
基于自然语言处理的方法,是指采用自然语言处理技术对专利文本内 容分析,从专利的标题、摘要、说明书、权利说明书等文本中,获取表征 专利的有用特征,对特征赋予权重信息,检索相关专利文本,例如文章Some Issues in the Automatic Classification of U.S.Patents(该文作者是Leah S. Larkey,文章是AAAI-98文本分类学习研讨会上的特邀报告),介绍了采 用自然语言处理技术进行专利分类的方法。文章POSTECH at NTCIR-5 Patent Retrieval:Smoothing Experiments in a Language Modeling Approach to Patent Retrieval(该文作者是In-Su Kang,Seung-Hoon Na,Jun-Ki Kim, Jong-Hyeok Lee,文章发表在Proceedings of NTCIR-5 Workshop Meeting, December 6-9,2005,Tokyo,Japan),采用自然语言处理技术实现专利检索。
但是现有的方法仅局限于关键词检索,并且只针对专利文本之间的检 索,没有考虑非专利文本与专利文本、非专利文本与专利类别之间的关系, 不能实现非专利文本和专利文本的智能化全文检索。
发明内容
针对现有技术中面向专利领域的文档检索没有考虑非专利文本与专利 文本、非专利文本与专利类别之间的关系,不能实现非专利文本和专利文 本的智能化全文检索的不足之处,本发明要解决的技术问题是提供一种专 利检索的方法,能够实现专利文本的特征向量表示,计算非专利文本与相 关的专利文本相似度,检索到最相关的专利文本。
为解决上述技术问题,本发明采用的技术方案基于自然语言处理技术 的专利检索方法,包括以下步骤:
对查询文本和专利文本进行预处理;
检索与查询文本相关的专利文本,采用多种不同相似度计算的方法得 到不同相似度的值,组合不同相似度的值,重新计算相似度,按新的相似 度的值对专利文本排序;
采用多种不同的决策方法,将专利文本的相似度排序映射成为专利类 别相关性的不同排序;对多个不同专利类别相关性排序结果进行整合,重 新排序得到新的专利类别相关性排序;
从新的专利类别相关性排序中,选择与查询文本最相关的专利类别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810012248.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:职称评定手持无线表决器
- 下一篇:一种声波控制密码电子锁系统