[发明专利]基于语义相关度的目标实体确定方法及装置有效
| 申请号: | 201610129768.8 | 申请日: | 2016-03-08 |
| 公开(公告)号: | CN105589976B | 公开(公告)日: | 2019-03-12 |
| 发明(设计)人: | 黄贵懿 | 申请(专利权)人: | 重庆文理学院 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36 |
| 代理公司: | 北京超凡志成知识产权代理事务所(普通合伙) 11371 | 代理人: | 吴开磊 |
| 地址: | 40216*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 语义 相关 目标 实体 确定 方法 装置 | ||
本发明提供了基于语义相关度的目标实体确定方法及装置,方法包括:根据用户实体及其当前语境在预设的实体关系库中确定用户实体对应的用户连通词集合,通过连通词的连通路径确定待定目标实体。根据用户实体与当前待定目标实体各个连通路径对应的路径权值,经综合计算后确定用户实体与当前待定目标实体之间的语义相关度,根据该语义相关度确定用户实体对应的目标实体。本发明中实体关系库通过搜索引擎动态生成和增长,可以实现实体信息的快速更新。在判断实体间语义相关度时,能结合语境区分歧义。
技术领域
本发明涉及信息处理领域,尤其涉及一种基于语义相关度的目标实体确定方法及装置。
背景技术
命名实体指的是人名、机构名、地名以及其他所有以名称为标识的实体,如“老人与海”、“清华大学”、“北医三院”等。更广泛的命名实体还包括数字、日期、货币、地址等。随着语义研究以及命名实体(以下简称实体)研究技术的深入发展,多数情况下都需要在获知当前实体的情况下,根据语义相关度计算求解得到当前实体对应的目标实体。
例如,随着互联网搜索技术的发展,对用户输入的实体进行语义分析,得出用户输入的实体与其他实体之间的关系度,将关系度较大的实体确定为用户输入的实体对应的目标实体,并将目标实体推荐给用户,从而为用户提供更多需要的信息。再如,随着实体语义聚类研究的发展,可利用语义相关度对目标实体进行实体聚类分析,进而还可实现对短文本的语义聚类分析。再如,在已知当前实体时,对当前实体进行语义分析,得到当前实体与任意一个实体之间的语义关系连接词,可为判断两实体间的语义关系提供帮助。
现有技术确定目标实体的方法一般两种,一种是基于语义词典的语义相关度计算方法;另一种是基于已分类的语料库或知识库的语义相关度计算方法。两者的基本原理是,首先获知当前实体,然后利用人工或机器预先构建并做好归类的实体的词典或知识库,通过类属关系计算当前实体与其他实体之间的语义相关度,根据计算出的语义相关度的情况确定当前实体对应的目标实体。其中,计算语义关系包括实体间的关系度和确定实体间的语义关系连接词。
发明人在研究中发现,现有技术无法应对以下情况:当获知的当前实体有多重含义时,如“人大”,既能够表示“中国人民大学”,也能够表示“人民代表大会”,则利用现有技术确定当前实体对应的目标实体时,有时会将“人大”判定成“中国人民大学”,从“中国人民大学”的角度出发进行语义分析,确定“人大”对应的目标实体,有时将“人大”判定成“人民代表大会”,从“人民代表大会”的角度出发进行语义分析,确定“人大”对应的目标实体。这种实体含义判定的不确定性导致语义相关度分析不准确,进而使得求解得到的目标实体不够准确。
可见,现有技术在确定目标实体时,当前实体有多重含义时,无法合理确定当前实体的含义,导致无法准确确定与当前实体对应的目标实体。
发明内容
本发明提供了一种基于语义相关度的目标实体确定方法及装置,当前实体有多重含义时,能够合理确定实体的含义,进而准确确定与当前实体对应的目标实体。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆文理学院,未经重庆文理学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610129768.8/2.html,转载请声明来源钻瓜专利网。





