[发明专利]邮箱作者对应方法和装置有效
申请号: | 201710574804.6 | 申请日: | 2017-07-14 |
公开(公告)号: | CN107577657B | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 霍东云 | 申请(专利权)人: | 北京赛时科技有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279 |
代理公司: | 北京易光知识产权代理有限公司 11596 | 代理人: | 孙海龙 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 邮箱 作者 对应 方法 装置 | ||
本发明公开了邮箱作者对应方法和装置及计算机可读存储介质,该邮箱作者对应方法,包括:邮箱查找步骤,在包含已知作者的作品的文件中查找邮箱;作者信息解析步骤,对已知作者进行姓名解析,获得所述已知作者的姓名信息以及姓名信息的缩略表达;匹配字段获取步骤,将所述已该作者的姓名信息以及姓名信息的缩略表达与所述邮箱的地址进行比对,确定邮箱的地址中包含的所述已知作者的姓名信息以及姓名信息的缩略表达,即匹配字段;置信度判断步骤,根据所获得匹配字段,判断邮箱是已知作者的邮箱的置信度;关联步骤,当判断出邮箱是已知作者的邮箱的置信度高于阈值时,将作者和所述邮箱相关联。
技术领域
本发明涉及信息检索,尤其涉及作者信息的检索。
背景技术
当检索出文章之后,可能需要和作者进行联系,这种联系可能需要邮箱、电话等方式。有的文章或许会列明一些电话和邮箱,但是通常并不指明是哪个作者的电话和邮箱,还是编辑部门的邮箱,如果检索出来的文章很多的情况,例如需要确定各个作者的邮箱供第三方使用时,更需要更准确的判断作者与邮箱的对应关系,提高对应的准确度。目前的现有技术还没有指示出这种需求,也没有提供相应的解决方案。
发明内容
本发明鉴于以上情况,提出用于缓解或消除现有技术中存在的一项或更多的缺点,至少提供一种有益的选择。
为实现以上目的,根据本发明的一个方面,公开了一种邮箱作者对应方法,包括:邮箱查找步骤,在包含已知作者的作品的文件中查找邮箱;作者信息解析步骤,对已知作者进行姓名解析,获得该已知作者的姓名信息以及姓名信息的缩略表达;匹配字段获取步骤,将所述已该作者的姓名信息以及姓名信息的缩略表达与所述邮箱的地址进行比对,确定所述邮箱的地址中包含的该已知作者的姓名信息以及姓名信息的缩略表达,即匹配字段;置信度判断步骤,根据所述匹配字段获取步骤所获得匹配字段,判断邮箱是该已知作者的邮箱的置信度;关联步骤,当置信度判断步骤判断出该邮箱是该已知作者的邮箱的置信度高于阈值时,将该已知作者和所述邮箱相关联。
依据一种实施方式,所述方法还包括干扰判断步骤,所述干扰判断步骤判断所述匹配字段的匹配是否受干扰,所述置信度判断步骤根据所述匹配字段获取步骤所获得匹配字段以及干扰判断步骤的判断结果,判断所述邮箱是所述已知作者的邮箱的置信度。
根据本发明的另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时能够实现本发明的各种方法的步骤。
根据本发明的又一方面,提供了一种邮箱作者对应装置,包括:邮箱查找单元,在包含已知作者的作品的文件中查找邮箱;作者信息解析单元,对所述已知作者进行姓名解析,获得所述已知作者的姓名信息以及姓名信息的缩略表达;匹配字段获取单元,将所述已该作者的姓名信息以及姓名信息的缩略表达与所述邮箱的地址进行比对,确定所述邮箱的地址中包含的所述已知作者的姓名信息以及姓名信息的缩略表达,即匹配字段;置信度判断单元,根据所述匹配字段获取单元所获得匹配字段,判断所述邮箱是所述已知作者的邮箱的置信度;关联单元,当所述置信度判断单元判断出所述邮箱是所述已知作者的邮箱的置信度高于阈值时,将所述已知作者和所述邮箱相关联。
根据本发明,可以容易并准确地将作者和邮箱关联起来。
附图说明
结合附图,可以更好地理解本发明。但是附图仅仅是示例性的,不是对本发明的保护范围的限制。
图1示出了依据本发明一种实施方式的作者与邮箱对应方法的示意性流程图;
图2示出了依据本发明一种实施方式的作者与邮箱对应装置的示意性方框图。
具体实施方式
下面结合附图,对本发明的具体实施例作进一步详述,但不构成对本发明的任何限制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京赛时科技有限公司,未经北京赛时科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710574804.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本隐含语义激活方法及系统
- 下一篇:词向量处理方法、装置以及电子设备