[发明专利]目标人物间亲密度识别方法、装置、电子设备及存储介质有效
| 申请号: | 201911056228.1 | 申请日: | 2019-10-31 |
| 公开(公告)号: | CN110825847B | 公开(公告)日: | 2022-09-02 |
| 发明(设计)人: | 陈鹏礼;尚高峰;杜国强 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/335;G06F40/279 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 李欣;丁芸 |
| 地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标 人物 亲密 识别 方法 装置 电子设备 存储 介质 | ||
1.一种目标人物间亲密度识别方法,其特征在于,所述方法包括:
获取语料库,所述语料库包括多个待分析文本数据;
利用预设的热词提取方法,从所述语料库中提取各热词,并获取所述各热词的亲密度标注信息;将所述各热词及所述各热词的亲密度标注信息存入热词库;
针对所述多个待分析文本数据中的各条句子,若识别出该条句子中包括至少两个目标人物的名称,则将该条句子添加至候选语料集;
针对所述候选语料集中的各条句子,分别执行如下步骤:识别该条句子中表示目标人物亲密度的各观点词;分别将所述各观点词与所述热词库中的各热词进行匹配,得到所述各观点词的亲密度;根据所述各观点词的亲密度,确定该条句子对应的至少两个目标人物的亲密度关系;
针对一组指定的至少两个目标人物,根据所述候选语料集中各条句子对应的所述指定的至少两个目标人物的亲密度关系,确定所述指定的至少两个目标人物间的亲密度。
2.根据权利要求1所述的方法,其特征在于,在所述针对所述多个待分析文本数据中的各条句子,若识别出该条句子中包括至少两个目标人物的名称,则将该条句子添加至候选语料集之前,所述方法还包括:
分别将所述多个待分析文本数据中的各文本数据分割成多条句子,并对分割后的各条句子分别进行分词处理,得到所述分割后的各条句子中的分词数据;
针对所述多个待分析文本数据中的各条句子,识别该条句子中是否包括至少两个目标人物的名称的方式,包括:
针对所述分割后的各条句子,判断该条句子中的分词数据是否包括至少两个目标人物的名称。
3.根据权利要求1或2所述的方法,其特征在于,在所述针对所述多个待分析文本数据中的各条句子,识别出该条句子中包括至少两个目标人物的名称之后,所述方法还包括:
查询预先建立的目标人物关系表,判断所述至少两个目标人物间是否存在关系;
所述将该条句子添加至候选语料集,包括:
若识别出该条句子中包括至少两个目标人物的名称,且所述至少两个目标人物间存在关系,则将该条句子添加至候选语料集。
4.根据权利要求1所述的方法,其特征在于,所述观点词包括表示至少两个目标人物间亲密关系的关系词;
所述识别该条句子中表示目标人物间关系的各观点词,包括:
识别该条句子中至少两个目标人物的名称,以及该条句子中表示所述至少两个目标人物间亲密关系的关系词;
所述分别将所述各观点词与所述热词库中的各热词进行匹配,得到所述各观点词的亲密度,包括:
将所述关系词与所述热词库中的各热词进行匹配,得到所述关系词的亲密度;
所述根据所述各观点词的亲密度,确定该条句子对应的至少两个目标人物的亲密度关系,包括:
若所述关系词的亲密度为正向亲密度,则确定该条句子对应的所述至少两个目标人物的亲密度关系为正向亲密度关系;
若所述关系词的亲密度为负向亲密度,则确定该条句子对应的所述至少两个目标人物的亲密度关系为负向亲密度关系。
5.根据权利要求4所述的方法,其特征在于,所述观点词还包括表示任一目标人物情感的情感词;
所述识别该条句子中表示目标人物间关系的各观点词,包括:
若该条句子中不存在所述关系词,则识别该条句子中分别表示各目标人物情感的情感词;
所述分别将所述各观点词与所述热词库中的各热词进行匹配,得到所述各观点词的亲密度,包括:
分别将各情感词与所述热词库中的各热词进行匹配,得到所述各情感词的亲密度;
所述根据所述各观点词的亲密度,确定该条句子对应的至少两个目标人物的亲密度关系,包括:
统计亲密度为正向亲密度的情感词第一数目、亲密度为负向亲密度的情感词第二数目;
若所述情感词第一数目大于所述情感词第二数目,则确定该条句子对应的所述至少两个目标人物的亲密度关系为正向亲密度关系;
若所述情感词第一数目小于所述情感词第二数目,则确定该条句子对应的所述至少两个目标人物的亲密度关系为负向亲密度关系;
若所述情感词第一数目等于所述情感词第二数目,则确定该条句子对应的所述至少两个目标人物的亲密度关系为中性亲密度关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911056228.1/1.html,转载请声明来源钻瓜专利网。





