[发明专利]一种确定人物间关联关系的方法及装置有效
申请号: | 202110210439.7 | 申请日: | 2021-02-25 |
公开(公告)号: | CN112883727B | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 夏书银;李臻;王国胤;罗跃国 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/295;G06F16/335;G06F16/383;G06F16/387 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 喻英 |
地址: | 400000 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 人物 关联 关系 方法 装置 | ||
本发明公开了一种确定人物间关联关系的方法及装置,该方法通过人名实体模型对各英文文本数据进行英文人名识别,并通过拼音人名词库和拼音地名词库对各英文文本数据进行拼音人名识别,当不同英文文本数据中存在共同的英文人名和/或拼音人名时,则表示待识别人物关键词之间存在关联,通过确定人物之间是否存在共同的关联人,以确定人物之间的关联关系,提高关系分析的准确性。
技术领域
本发明属于互联网通信技术领域,具体涉及一种确定人物间关联关系的方法及装置。
背景技术
随着互联网的不断发展,网络中的英文文本数据呈爆发式增长,人们在关注某些新闻事件过程中,常常会分析各个人物之间的关联关系,如何从海量的信息中快速得到分析结果已成为一个亟待解决的问题。现有的研究中主要是根据两个用户间是否存在直接接触确定二者之间是否存在关联关系。如在社交平台网站上,我们常常通过两个用户之间是否互相关注的方式判断两者间是否存在关联。但在没有人物的具体交集关系数据时则无法确定二者是否存在关联关系。
发明内容
本发明要解决的技术问题是目前通过确定人物之间是否直接接触以确定人物间是否存在关联关系,局限性非常大,当出现人物之间没有直接关系时,则无法确定人物间的关联关系。因此,本发明提供一种确定人物间关联关系的方法及装置,通过确定人物之间是否存在共同的关联人,以确定人物之间的关联关系,提高关系分析的准确性。
本发明通过下述技术方案实现:
一种确定人物间关联关系的方法,包括:
获取至少两个待识别人物关键词,并基于至少两个所述人物关键词搜索对应的所有英文文本数据;
通过人名实体模型对各所述英文文本数据进行英文人名识别,并通过拼音人名词库和拼音地名词库对各所述英文文本数据进行拼音人名识别,提取所述英文文本数据中的人名;
将各英文文本数据中提取到的人名进行比较,当不同英文文本数据中存在共同的人名时,则表示待识别人物关键词之间存在关联,并存储共同的人名与对应的英文文本数据。
进一步地,所述英文文本数据中的人名包括英文人名和/或拼音人名;
当所述英文文本数据中的人名仅为英文人名时,则将各英文文本数据中提取到的英文人名进行比较,当不同英文文本数据中存在共同的英文人名,则表示待识别人物关键词之间存在关联,并存储共同的英文人名与对应的英文文本数据;
当所述英文文本数据中的人名仅为拼音人名时,则将各英文文本数据中提取到拼音人名进行比较,当不同英文文本数据中存在共同的拼音人名时,则表示待识别人物关键词之间存在关联,并存储共同的拼音人名与对应的英文文本数据;
当所述英文文本数据中的人名包括英文人名和拼音人名时,则将各英文文本数据中提取到的拼音人名进行比较,当不同英文文本数据中存在共同的拼音人名,则表示待识别人物关键词之间存在关联,并存储共同的拼音人名对应的英文文本数据;
当不同英文文本数据中不存在共同的英文人名,则将各英文文本数据中提取到的拼音人名进行比较,当不同英文文本数据中存在共同的拼音人名,则表示待识别人物关键词之间存在关联,并存储共同的拼音人名对应的英文文本数据。
进一步地,所述通过拼音人名词库和拼音地名词库对各所述英文文本数据进行拼音人名识别,包括:
将各英文文本数据中除空格外的非字母字符转换为预设符号,得到预处理英文文本数据;
对所述预处理英文文本数据进行分词,得到分词结果;
通过拼音人名词库对所述分词结果中的每一个分词进行识别,获取初始人名识别结果;
将所述初始人名识别结果与拼音地名词库进行匹配,若匹配不成功,则将所述初始人名识别结果作为拼音人名;若匹配成功,则删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110210439.7/2.html,转载请声明来源钻瓜专利网。