[发明专利]一种用于为文档匹配评议专家的系统以及方法在审
申请号: | 202110856600.8 | 申请日: | 2021-07-28 |
公开(公告)号: | CN113516094A | 公开(公告)日: | 2021-10-19 |
发明(设计)人: | 梁英;谢小杰;刘政君;王梓森 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 文档 匹配 评议 专家 系统 以及 方法 | ||
本发明实施例提供了一种用于为文档匹配评议专家的系统以及方法,该系统包括:专家特征提取模块,其利用神经网络用于根据专家描述文本和专家学术专长信息获取专家特征表示;文档特征提取模块,其利用神经网络根据待评议文档的文档描述、学科分类信息和关键词信息获取文档特征表示;专家匹配模块,其利用神经网络根据专家特征表示和文档特征表示计算专长匹配度,并基于专长匹配度生成候选专家列表;本发明在专家和待评议文档方面均从不同的类别提取相关的信息,以更精准地提取到两者的语义特征,降低语义鸿沟,提高专家推荐的精度。
技术领域
本发明涉及信息匹配技术领域,具体来说涉及学术数据挖掘领域,更具体地说,涉及一种用于为文档匹配评议专家的系统以及方法。
背景技术
同行评议是若干领域的专家共同对学术成果、科技项目、科研学者等进行评价的活动。随着同行评议和学术科研活动的蓬勃发展,新的同行评议需求不断地被提出,专家库信息不断地被更新和规模增大,使得专家推荐的需求飞速增长。专家推荐通过学术专长匹配和专家遴选两步为同行评议提供一批满足评议要求的专家,成为了同行评议活动顺利开展的基础,在诸如项目评审、论文评审、技术招标、科技成果奖励与孵化、需求对接等同行评议活动中获得了广泛应用。作为专家推荐的重要环节,学术专长匹配的目的是根据待评议文档对专家库中的专家进行匹配,为后续的专家遴选提供专业背景相符的候选专家列表。根据具体同行评议场景的不同,待评议文档包括:1)项目评审场景的项目指南;2)论文评审场景的学术论文;3)技术招标场景的招标文档;4)科研成果奖励与孵化场景的科研成果;5)需求对接场景的需求文档。学术专长匹配通过专家信息和待评议文档确定专家的匹配程度,实现在同行评议活动中精确匹配出候选专家,从而保证专家推荐的匹配精准度和同行评议的质量。
现有的用于为文档匹配评议专家的技术主要存在如下的缺点和不足:
1)没有充分利用专家和待评议文档的多类特征信息,导致学术专长匹配精准度不高。现有学术专长匹配技术主要根据专家描述文本和待评议文档的描述文本进行特征建模,通过主题建模和文本表示提取特征,仅利用了单一的文本信息,忽略了其他语义特征,导致学术专长匹配结果不准确。
2)没有考虑到学术专长匹配的语义鸿沟问题,难以准确建模信息间的语义相关性。现有学术专长匹配技术主要通过关键词搜索的方式进行匹配,造成关键词和信息之间的存在语义鸿沟问题,特征表示建模的方式也仅能提取信息中的浅层语义特征,无法对语义特征进行深度刻画。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种用于为文档匹配评议专家的系统以及方法。
本发明的目的是通过以下技术方案实现的:
根据本发明的第一方面,提供一种用于为文档匹配评议专家的系统,包括:专家特征提取模块,其利用神经网络根据专家描述文本和专家学术专长信息获取专家特征表示;文档特征提取模块,其利用神经网络用于根据待评议文档的文档描述、学科分类信息和关键词信息获取文档特征表示;专家匹配模块,其利用神经网络用于根据专家特征表示和文档特征表示计算专长匹配度,并基于专长匹配度生成候选专家列表。
在本发明的一些实施例中,所述专家特征提取模块包括:专家文本特征提取单元,用于提取专家描述文本的特征以生成专家文本特征表示;学术专长特征提取单元,用于根据专家学术专长信息提取其中每种学术专长的向量表示,并通过向量加法进行池化融合,生成学术专长特征表示;专家特征融合单元,用于拼接专家文本特征表示和学术专长特征表示,对拼接得到的向量进行线性变换,生成专家特征表示。
在本发明的一些实施例中,所述专家文本特征提取单元包括全连接网络和卷积神经网络,并被配置为根据单词嵌入表和全连接网络将专家描述文本中的每个单词转换为单词向量,根据卷积神经网络对所有单词向量进行卷积操作得到每个单词的特征映射向量,根据池化函数对所有特征映射向量进行池化操作,得到专家文本特征表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110856600.8/2.html,转载请声明来源钻瓜专利网。