[发明专利]一种结合标签构建与社区关系规避的专家推荐方法有效
| 申请号: | 201911207076.0 | 申请日: | 2019-11-29 | 
| 公开(公告)号: | CN111008215B | 公开(公告)日: | 2021-04-06 | 
| 发明(设计)人: | 冯凯;彭亮;王元卓;刘冰冰;康锐文;贾士杨 | 申请(专利权)人: | 中科院计算技术研究所大数据研究院 | 
| 主分类号: | G06F16/245 | 分类号: | G06F16/245;G06F16/35 | 
| 代理公司: | 郑州明华专利代理事务所(普通合伙) 41162 | 代理人: | 王明朗 | 
| 地址: | 450000 河南省郑州*** | 国省代码: | 河南;41 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 结合 标签 构建 社区 关系 规避 专家 推荐 方法 | ||
本发明公开了一种结合标签构建与社区关系规避的专家推荐方法,对科技领域的专利数据库和论文数据库进行采集,提取出论文数据库中的作者以及专利数据库中的发明人形成专家列表。然后对专家的属性信息补全,根据属性信息完成专家属性抽取和领域标签抽取,根据专家之间的关系形成科技领域的专家库。然后根据专家的领域标签过滤匹配度高的专家集合S1,得到需要规避的专家集合S2,得到初步推荐的专家,即S=S1‑S2,并按照相关领域影响力排序得到最终的专家推荐列表。本发明合理的进行专家规避,根据专家的领域标签以及影响力推荐高水平、高影响力、高责任心的专家。有效的提高了专家挑选的工作效率,同时提高了科技评价或评审的科学性、公正性、独立性以及客观性。
技术领域
本发明属于数据挖掘技术领域,具体涉及一种结合标签构建与社区关系规避的专家推荐方法。
背景技术
专家是科技评价或评审工作的主体,专家库中所选取的专家的个人素养及学术水平直接关系到科技评价或评审活动的质量,并最终影响科技咨询与决策工作的质量与科学性。因此,建设科学的专家库以及挑选合适的专家进行科技评价或评审至关重要。然而,目前我国存在专家库信息不完整、更新不及时等问题。同时在评审专家挑选时存在效率低以及违规等问题,主要表现在以下两个方面。(1)目前专家库中的专家主要来源于高等院校、科研院、各类科技政府机构所等机构,数据信息主要是由这些机构中的专家个人填写,极大地影响了专家数据库中专家信息的完整性、可靠性、及时性。从而导致专家数据库中专家信息尤其是学术研究信息的片面性、滞后性,无法准确反映专家实际工作情况。(2)目前在专家挑选时主要凭借直觉、印象、资历、名气、地位等“软”因素进行主观判断。存在未严格遵循项目回避、单位回避、特别要求的回避等原则,从专家库中抽取专家;缺乏选择高水平、高责任心、无利益冲突的评审专家的科学依据。
这不仅大大降低挑选专家的工作效率,还容易存在覆盖面不全、人工干预多、专家学者对科技咨询内容了解程度不一致等问题;在实际评审工作中,也频繁地出现由于人际关系网或个人名人效应造成的领导项目、人情项目、照顾平衡项目等不良现象。这一切都严重影响了科技评价或评审的科学性、公正性、独立性以及客观性。
发明内容
本发明针对目前科技评价或者评审工作时挑选专家存在的问题,提出了一种结合标签构建与社区关系规避的专家推荐方法。用以提高科技评价或评审时专家挑选的工作效率;提高科技评价或评审的科学性、公正性、独立性以及客观性。
为实现上述目的,本发明采用的技术方案为:一种结合标签构建与社区关系规避的专家推荐方法,包括以下步骤。
步骤1:对科技领域的专利数据库和论文数据库进行采集,提取出论文数据库中的作者以及专利数据库中的发明人,形成专家列表。然后对专家的属性信息补全,根据属性信息完成专家属性抽取和领域标签抽取。根据专家之间的关系形成科技领域的专家库。最后根据专家发表的论文数、论文影响因子、论文被引数、H指数和专利数等维度进行建模,计算专家在相关领域的影响力。
步骤2:根据科技评审资料提取相关的科技领域,然后根据专家的领域标签过滤匹配度高的专家集合S1。同时提取科技评审资料中相关的申请人信息,作为需要直接规避的专家。然后根据社区发现算法以及专家之间的复杂关系,得到专家的社区关系。根据需要直接规避的专家及其关系比较紧密的专家社区关系,得到需要规避的专家集合S2。然后将推荐的专家集合S1中过滤掉需要规避的专家集合S2得到初步推荐的专家,即S=S1-S2。
步骤3:得到初步推荐专家后按照影响力与其他限制条件进行二次过滤,并按照相关领域影响力排序得到最终的专家推荐列表。
需要规避的专家集合S2的算法执行过程如下。
(1)给定网络G(V,E),其中V为点集,E为边集,将网络G中的每条边初始一个社区,即P0=(C1,C2,…,C|E|)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科院计算技术研究所大数据研究院,未经中科院计算技术研究所大数据研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911207076.0/2.html,转载请声明来源钻瓜专利网。





