[发明专利]一种基于专利的科技人才推荐方法有效
申请号: | 201710825493.6 | 申请日: | 2017-09-14 |
公开(公告)号: | CN107656920B | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 徐小良;吴远超;王宇翔 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/30;G06F40/216;G06F16/33;G06Q10/10;G06Q10/06 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 专利 科技人才 推荐 方法 | ||
本发明公开了一种基于专利的科技人才推荐方法。该方法包括以下步骤:对专利数据进行预处理,利用科技词对专利文档进行表示;使用词嵌入模型,以词频为权重进行加权平均,对专利文档语义向量化;聚合科技人才的相关专利文档对其科研能力进行表示;将技术需求进行语义向量化,利用余弦相似度计算技术需求与各专利文档之间的相关度,用高斯核函数确定技术需求与各专利文档的计算权重,最后以局部线性加权的方式得到技术需求与科技人才之间的相关度评分;最后,根据相关度评分进行排序,将评分靠前的科技人才作为推荐结果。该方法对科技人才的科研能力和技术需求等实现了语义化表示,同时克服了传统方法中的维度灾难问题。
技术领域
本发明涉及自然语言处理和推荐领域,具体涉及一种基于专利的科技人才推荐方法。
背景技术
促进科技成果转移转化是实施创新驱动发展战略的重要任务,是加强科技与经济紧密结合的关键环节,对于推进结构性改革尤其是供给侧结构性改革、支撑经济转型升级和产业结构调整,促进大众创业、万众创新,打造经济发展新引擎具有重要意义。2016年国务院发布《促进科技成果转移转化行动方案》,明确鼓励运用新一代信息技术,加强科技成果数据资源开发利用。然而,在专利等科技成果数据资源开发利用中,智能匹配符合用户需求的精准科技成果及相应人才信息是亟需解决的一个关键技术问题。
目前,很多网络文献资源库和技术对接交易平台只能提供基于关键词的成果与人才搜索功能,检索结果不精准,用户体验差,难以针对企业具体技术问题精准检索成果并推荐合适人才。为了提高人才推荐的精准度,主要的解决方法是引入相应的语义技术,如利用传统的词袋模型(Bag Of Words,BOW)并应用奇异值分解(Singular ValueDecomposition,SVD)进行降维的潜在语义分析模型(Latent Semantic Analysis,LSA)、在LSA的基础上提出的概率潜在语义分析模型(Probabilistic latent semantic analysis,pLSA)和潜在狄利克雷分配模型(Latent Dirichlet allocation,LDA)等。这些方法中,简单的将人才的所有成果数据拼接成一个大文档,粒度较粗,无法准确刻画该人才的领域科研能力。同时,这些方法不能有效解决维度灾难的问题。
发明内容
为解决上述问题,本发明提出了一种基于专利的科技人才推荐方法。该方法聚合科技人才的相关专利文档对其科研能力进行表示,并引入词嵌入(word embedding)技术,对专利文档进行语义向量化,进而将每个科技人才的科研能力表示为一个低维的实数向量组,解决了维度灾难问题。在针对技术需求进行推荐时,使用局部线性加权的方法计算综合评分,按得分高低进行推荐,其特征刻画更准确,从而可以得到更佳的推荐效果。
本发明所提出的一种基于专利的科技人才推荐方法具体内容如下:
1.专利数据预处理
对所有专利数据,通过数据处理和机器学习的方法,构建出科技词袋T和对应的词嵌入表示E。对每一个科技词ti∈T,都有且只有一个对应的语义向量ei∈E。然后使用此科技词袋,对每一篇专利文档进行中文分词,且只保留出现在科技词袋T中的词,得到专利文档集合D={d1,d2,...di,...,dn},其中di表示某一篇专利文档,该专利文档由一组科技词组成:
其中,代表文档di的第k个科技词,且是科技词袋T中的某个词。
同时还需要对数据进行结构化处理。提取专利发明人作为科技人才,并进行关联,消歧等处理,得到科技人才集合P。每一个科技人才pi的专利文档集合用Di表示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710825493.6/2.html,转载请声明来源钻瓜专利网。