[发明专利]基于学科知识图谱的推荐专家方法有效
| 申请号: | 201810634499.X | 申请日: | 2018-06-20 |
| 公开(公告)号: | CN108920556B | 公开(公告)日: | 2021-11-19 |
| 发明(设计)人: | 林欣;孙琪力;窦建凯;刘贝;孙传翔;李定邦 | 申请(专利权)人: | 华东师范大学 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/35;G06K9/62 |
| 代理公司: | 上海蓝迪专利商标事务所(普通合伙) 31215 | 代理人: | 徐筱梅;张翔 |
| 地址: | 200241 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 学科 知识 图谱 推荐 专家 方法 | ||
本发明公开了一种基于学科知识图谱的推荐专家方法,该方法应用知识图谱对项目进行分类并对分类后的项目组匹配合适的评审专家,包括以下步骤:用维基百科链接相似度建立关键词到学术知识图谱节点的映射,计算两两项目间的类别相似度和关键词相似度,用凝聚的层次聚类算法为项目分组,计算项目组和专家间的类别相似度和关键词相似度,用贪心算法为项目组分配专家。本发明灵活易用,适用范围广泛;能够为科研审核机构找到合适的项目分组,并为各个项目组挑选合适的评审专家进行分批评审。
技术领域
本发明涉及自然语言处理领域和数据库的实体匹配和实体映射领域,具体地说是一种使用学科知识图谱的数据作为辅助知识,批量地对项目申报名单中的项目进行分类归并,获得若干个项目分组,并为各个项目组分别挑选出若干合适的评审专家的方法。
背景技术
近年来,随着硬件性能的提高和互联网上信息的爆炸,大数据处理和分析的方法得到了迅速发展并在很多领域有了越来越广泛的应用。知识图谱作为一种新兴的大数据处理手段,在提高信息检索质量方面有着巨大的优势。
知识图谱的概念由谷歌最先提出,当时主要是用于辅助其搜索引擎进行信息检索。随着近年来大数据处理和分析方法的发展,知识图谱在智能搜索、智能问答、智能推荐等领域都有了广泛的应用。特别是在智能搜索领域,知识图谱的出现弥补了单纯通过关键词匹配进行搜索的不足,搜索引擎可以一定程度上对用户查询的具体意图做出有根据的猜测,实现了概念检索或者语义检索。在知识图谱的支持下,计算机能够更好地理解人类语言的表达模式,智能地为用户反馈更为契合需求的检索结果。除此之外,知识图谱的结构特点使得各种信息实体之间的关系能够被清晰地反映出来,从而将信息聚合为知识,使信息更容易被理解,评价和利用,最终形成一个语义知识库。
知识图谱从本质上来说是一种语义网络,它将现实世界里的各种事物和事物之间的各种关联转化为了更加便于计算机处理的“实体和实体的属性-值”二元组和“实体-关系-实体”三元组的形式。如今,知识图谱的概念得到了泛化,各类大型的知识库也都被称作知识图谱。
发明内容
本发明的目的是提供一种基于学科知识图谱的推荐专家方法,方法使用了微软的学术知识图谱(Microsoft Academic Graph),国家自然科学基金申请代码树和维基百科(Wikipedia)的词条页面互链等图谱数据作为检索的辅助。学科背景相似度的计算结合使用了链接相似度、路径相似度和余弦相似度的思想。方法主要使用了凝聚的层次聚类算法分组项目,主要使用了贪心算法推荐专家。
本发明的目的是这样实现的:
一种基于学科知识图谱的推荐专家方法,该方法包括以下具体步骤:
步骤1:分组项目
输入一个从人工填写的申报项目列表中提取得到的项目实例全集P,其中的项目实例p∈P包括项目编号、项目名称、申报单位、国家自然科学基金学科类别(下文中简称为“类别”,其包含一个国家自然科学基金申请代码,申请代码形如“G0304|产业政策与管理”)和英文关键词集合(包含一个或数个英文关键词)等属性,输出对P的一个划分D={P1,P2,…,Pn},P1~Pn均为学科背景较为相似的项目实例组成的项目实例子集;
步骤2:推荐专家
输入步骤1获得的划分D和专家信息数据库中提取得到的候选专家实例全集E,其中的专家实例e∈E包括专家编号、专家名称、年龄、职称、单位、国家自然科学基金学科类别集合(下文中简称为“类别集合”,其包含一个或数个国家自然科学基金申请代码,申请代码形如“G0304|产业政策与管理”)和英文关键词集合(包含一个或数个英文关键词)等属性,输出是专家实例全集E的若干个互无交集的子集E1,E2,…,En,E1~En和P在划分D下的子集P1~Pn有一一对应的关系,即Ei(1≤i≤n)表示推荐去评审项目实例子集Pi的专家实例子集。所述步骤1具体包括:
步骤A1:使用各个项目实例里的类别,计算两两项目实例之间的类别相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810634499.X/2.html,转载请声明来源钻瓜专利网。





