[发明专利]一种辨别同名作者的方法和装置在审
申请号: | 201611240416.6 | 申请日: | 2016-12-29 |
公开(公告)号: | CN108255846A | 公开(公告)日: | 2018-07-06 |
发明(设计)人: | 崔星汉;方垚;霍东云;李燕茜 | 申请(专利权)人: | 北京赛时科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京易光知识产权代理有限公司 11596 | 代理人: | 孙海龙 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 作品 作品信息 方法和装置 判断步骤 辨别 信息获取步骤 信息判断 制作 | ||
本发明公开了一种辨别同名作者的方法和装置,包括以下步骤:已定作品信息收集步骤,收集已定作品的作品信息,已定作品是指作者已经明确的作品;经历信息获取步骤,根据所收集的作品信息获得或制作该已定作品的作者经历信息;领域判断步骤,判断同名作者作品的领域;相关性判断步骤,根据所述作者经历信息判断该同名作者作品与该已定作品的相关性。
技术领域
本发明涉及作者的分类。
背景技术
姓名不具有唯一性,同名同姓者甚多。这在文献检索等工作中会带来很大的不便。例如,当想要检索某一作者的所有文献时,可能检索的结果中会包含其他同名作者的文献,使得检索者出现混淆,对其所进行的研究出现误判。因此需要一种辨别同名作者是否为同一人的系统。
已知的一种技术方案首先生成某一文献的文献特征信息的集合,然后比较该文献的特征集合与另一篇文献的特征集合的相似性,如果相似,则判断为是同一人作品,如果不相似,则判断为不是同一人作品。其中,文献特征一般包括共同作者名称、文献标题以及文献发表处。但是该技术解决不了作者转行的问题。有很多作者其所做文章往往跨越多个领域,在不同的领域时,与其合作的共同作者、文献名称、以及文献发表处均不相同,因而该技术往往把同一人判断为不同领域的两个作者。
发明内容
本发明鉴于现有技术的上述缺点作出,旨在缓解或消除现有技术的上述缺点,至少提供一种有益的选择。
根据本发明的一个方面,提供了一种作者归类方法,
本发明涉及一种辨别同名作者的方法,包括以下步骤:已定作品信息收集步骤,收集已定作品的作品信息,已定作品是指作者已经明确的作品;经历信息获取步骤,根据所收集的作品信息获得或制作该已定作品的作者经历信息;领域判断步骤,判断同名作者作品的领域;相关性判断步骤,根据所述作者经历信息判断该同名作者作品与该已定作品的相关性。
根据一种实施方式,所述作品信息包括收集作者信息、作者单位信息、出版日期信息,所述作者经历信息包括所学专业信息、工作单位信息、学习年份和工作年份信息。
根据一种实施方式,所述简历制作获取步骤包括根据所述工作单位信息,寻找该工作单位的网站,在该工作单位的网站上寻找该作者的简历和/或联系方式,作为所述作者经历信息。
根据一种实施方式,在领域判断步骤中,根据发表该同名作者作品的期刊或会议分类,标题、摘要或文章本体中的关键词判断该同名作者作品的领域。
根据本发明的另一方面,提供了一种辨别同名作者的装置,包括:已定作品信息收集单元,收集已定作品的作品信息,已定作品是指作者已经明确的作品;经历信息获取单元,根据所收集的作品信息获得或制作该已定作品的作者经历信息;领域判断单元,判断同名作者的作品的领域;相关性判断单元,根据所述作者经历信息结合所述同名作者的作品的领域,判断该同名作者的作品与该已定作品的作者的相关性,并根据相关性确定所述同名作者与已经明确的作者是否为相同人。
根据本发明的实施方式,可以更准确地判断同名作者是否为相同人。
附图说明
图1示出了依据本发明的一种实施方式的辨别同名作者的方法。
图2示出了依据本发明的另一种实施方式的辨别同名作者的方法。
图3示出了依据本发明的一种实施方式的辨别同名作者的装置。
具体实施方式
下面结合附图描述本发明的实施方式,这些实施方式仅仅是示例性的,不是对本发明的保护范围的限制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京赛时科技有限公司,未经北京赛时科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611240416.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种cookie生命期延长方法、装置和设备
- 下一篇:页面生成方法及装置