[发明专利]一种实体关系预测方法及装置有效
| 申请号: | 201811518633.6 | 申请日: | 2018-12-12 |
| 公开(公告)号: | CN109670050B | 公开(公告)日: | 2021-03-02 |
| 发明(设计)人: | 李锐 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G06F16/36 | 分类号: | G06F16/36;G06F16/332 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张小娜;王宝筠 |
| 地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 实体 关系 预测 方法 装置 | ||
本申请公开了一种实体关系预测方法及装置,该方法包括:在获取到包含同一实体对的不同目标文本后,首先确定出每一目标文本分别对该实体对的实体关系的体现程度,其中,该实体对包括两个不同的实体词,然后根据每一目标文本分别对该实体对的实体关系的体现程度,预测该实体对的实体关系。可见,本申请实施例在对实体对的实体关系进行预测时,考虑了包含该实体对的不同目标文本对该实体对的实体关系的体现程度,从而能够更准确地预测出该实体对的实体关系。
技术领域
本申请涉及自然语言处理技术领域,尤其涉及一种实体关系预测方法及装置。
背景技术
在当前的自然语言处理领域中,关系抽取(relation extraction)任务通常被广泛应用于数据简化和构建知识图谱中。关系抽取通常指两个不同实体(又称实体对)之间的关系抽取,其中,实体泛指一切能够独立存在的东西,比如作品、人物、地点、机构等。
对于用户输入的一段自然语言,该段自然语言是一种非结构化文本,需要在该非结构化文本中正确识别出两个不同实体,并在此基础上预测出该非结构化文本中的两个不同实体之间的关系类别,用于形成结构化的数据,以便进行后续的存储和使用。但是,现有的实体关系预测方法,其预测结果的准确性还有待提高。
发明内容
本申请实施例的主要目的在于提供一种实体关系预测方法及装置,能够提高实体关系的预测结果的准确性。
本申请实施例提供了一种实体关系预测方法,包括:
获取包含同一实体对的不同目标文本,所述实体对包括两个不同的实体词;
确定每一目标文本分别对所述实体对的实体关系的体现程度;
根据每一目标文本分别对所述实体对的实体关系的体现程度,预测所述实体对的实体关系。
可选的,所述确定每一目标文本分别对所述实体对的实体关系的体现程度,包括:
对于每一目标文本,根据所述目标文本的文本内容,生成所述目标文本的文本表达结果,所述文本表达结果中携带了所述实体对的实体关系的相关信息;
根据各个目标文本的文本表达结果,分别确定每一目标文本对所述实体对的实体关系的体现程度。
可选的,所述根据所述目标文本的文本内容,生成所述目标文本的文本表达结果,包括:
通过分析所述目标文本中各个词语之间的依赖关系,生成所述目标文本的文本表达结果。
可选的,所述通过分析所述目标文本中各个词语之间的依赖关系,生成所述目标文本的文本表达结果,包括:
将所述目标文本的每一词语分别作为目标词语;
提取每一目标词语的词语特征;
对于每一目标词语,根据所述目标词语的词语特征生成所述目标词语的第一语义表达结果,并根据所述目标词语以及所述目标词语的相邻词语各自的第一语义表达结果,生成所述目标词语的第二语义表达结果;
根据各个目标词语的第二语义表达结果,生成所述目标文本的文本表达结果。
可选的,所述目标词语的词语特征包括所述目标词语的语义信息、以及所述目标词语的位置信息和/或所述目标词语的句法信息。
可选的,按照下述方式确定所述目标词语的相邻词语:
若所述目标词语是所述实体对中的一个实体词,则所述目标词语的相邻词语不包括所述实体对的另一实体词;
若所述目标词语不是所述实体对中的一个实体词、且所述实体对的两个实体词位于所述目标词语的同侧,则所述目标词语的相邻词语包括与所述目标词语最近的实体词;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811518633.6/2.html,转载请声明来源钻瓜专利网。





