[发明专利]基于主题驱动的专利推荐方法、系统、设备及存储介质在审
申请号: | 202110030170.4 | 申请日: | 2021-01-11 |
公开(公告)号: | CN112686042A | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 刘伟;杨尚伟;谭铧铧 | 申请(专利权)人: | 重庆摩托车(汽车)知识产权信息中心 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F40/30;G06Q50/18 |
代理公司: | 重庆智慧之源知识产权代理事务所(普通合伙) 50234 | 代理人: | 高彬 |
地址: | 401120*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 主题 驱动 专利 推荐 方法 系统 设备 存储 介质 | ||
本发明提供基于主题驱动的专利推荐方法、系统、设备及存储介质,其中,方法包括:获取候选专利和待测专利的主题信息、发明人信息和申请人信息,根据主题信息获取采样单词,将发明人、申请人和采样单词分别与主题进行关联;构建主题模型并将关联后的发明人、申请人、采样单词和主题输入,训练主题模型,构成动态主题模型,将待测专利的主题信息输入动态主题模型,获取待测专利的文本特征表示,并将其输入训练后的词嵌入模型,获取待测专利和候选专利的文本嵌入量,并计算获取候选专利的相似度,根据相似度进行排序,获取待测专利的相似专利。本发明能够扩大专利匹配的有效范围和提高单词之间的关联性,从而提高专利推荐的精确度。
技术领域
本发明涉及专利推荐技术领域,尤其涉及一种基于主题驱动的专利推荐方法、系统、设备及存储介质。
背景技术
专利推荐是一种推荐专利文件的技术,该专利文件包含与给定目标专利相似的内容。近年来,以协助检索专利,分析专利文件,申请新发明专利等为目的的自动专利推荐已成为一种新的流行研究领域。
目前主流的专利推荐算法主要包含以下几大类:
(1)基于内容的推荐。它主要是根据推荐专利的元数据,发现专利之间的相关性,然后基于用户以往的喜好记录,推荐给用户相似的专利。
(2)协同过滤的推荐。它主要是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣的专利,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤的目的进而帮助别人筛选推荐专利。
(3)基于知识的推荐。它主要是是根据用户指定的需求,系统给出设计方案,利用已有的知识,根据不同的相似度衡量方法检索出相似的专利,或依据明确定义的推荐规则的集合获取推荐专利集合进行推荐。
如上所述,目前针对专利的推荐方式主要问题有:
方法(1)简单易于实现,但是未能考虑专利内容本身的语义关联性,结果稀疏且无法按语义主题层次进行精准推荐;方法(2)推荐结果新颖扩展性强,但是由于用户评分行为信息较难以获得,存在数据稀疏和冷启动问题,同时由于用户之间的差异性,结果中可能出现一些与用户目标不相关的推荐结果,推荐结果不精准;方法(3)精准捕获用户需求能获得较好的推荐效果,但是用户本身需求存在不确定性和广泛性,无法对所有用户需求进行分析处理,导致方法难以实现和局限性。
因此,专利推荐的关键是解决专利语言术语和用户定义术语之间关键字不匹配问题。目前解决关键字不匹配问题的方法有三种:
(1)基于关键字的方法,例如查询关键字提取或查询扩展,以通过自动扩展关键字列表来匹配关键字或短语以找到相关专利。现有的专利搜索和分析系统,例如GooglePatent1,Patentics2,PriorArtSearch3等,都是基于这些方法的。在学术领域,引入了查询关键词提取技术来匹配单词或短语以找到相关专利。对于具有相同含义的单词问题,已经提出了一种使用词库自动将相似词包含在关键词中的方法,但是该方法需要词库的手动管理和扩展。响应于此,已经对相关反馈进行了初步搜索,并在初始搜索中使用前K个搜索结果来扩展关键字集。该方法仍然需要筛选初始搜索结果以调整搜索结果并获得具有相同含义的更准确的单词。对于这个问题,有人使用WordNet和Wikipedia作为知识库,以基于语义的概念丰富初始查询。此外,有科学家开发并验证基于文本的专利相似性度量,这也是基于关键字的专利相似性度量。不考虑语义的基于关键词的专利推荐有很大的局限性。最重要的一点是查询的专利中可能只有很少或没有相同的关键字,但是两个专利文件之间的主要思想可能非常相似。
(2)主题模型能够自动提取专利的关键字和主要思想,用于相关专利推荐。有人研究了如何将文本转换为基于单词袋(BOW)的单词列表或矢量数字列表,并通过挖掘全文所暗示的主题来推荐专利。有人研究了如何使用潜在狄利克雷分配和狄利克雷多项式回归来描述专利文件并分析其相似性。主题模型还忽略了单词的共现信息;因此,所获得的语义信息不够准确。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆摩托车(汽车)知识产权信息中心,未经重庆摩托车(汽车)知识产权信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110030170.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:杀菌系统、壁挂机及空调器
- 下一篇:一种验证码识别方法及装置