[发明专利]关系三元组的生成方法、装置、存储介质和电子设备在审
| 申请号: | 202010596226.8 | 申请日: | 2020-06-28 |
| 公开(公告)号: | CN111881683A | 公开(公告)日: | 2020-11-03 |
| 发明(设计)人: | 魏哲培;田原;常毅 | 申请(专利权)人: | 吉林大学 |
| 主分类号: | G06F40/295 | 分类号: | G06F40/295;G06F40/30 |
| 代理公司: | 北京恒博知识产权代理有限公司 11528 | 代理人: | 范胜祥 |
| 地址: | 130012 吉*** | 国省代码: | 吉林;22 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 关系 三元 生成 方法 装置 存储 介质 电子设备 | ||
本申请提供了一种关系三元组的生成方法、装置、存储介质和电子设备,其中,方法包括:获取输入文本对应的表示编码;从所述表示编码中识别出候选主体;判断所述表示编码中是否存在与所述候选主体具有目标语义关系的客体;若存在,根据所述候选主体、所述目标语义关系及所述客体,生成关系三元组。采用本申请实施例的方案,可全面准确地识别出输入文本中的关系三元组。
技术领域
本申请涉及信息处理技术领域,具体而言,涉及一种关系三元组的生成方法、装置、存储介质和电子设备。
背景技术
知识图谱的基本组成要素是关系事实,这些事实采用(主体,关系,客体)的形式将两个实体通过语义关系连接起来,称为关系三元组。从自然语言文本中抽取关系三元组是构建大规模知识图谱的关键步骤。然而目前生成关系三元组的方法都不够全面和准确。
发明内容
为了解决上述问题,本申请实施例提供了一种关系三元组的生成方法、装置、存储介质和电子设备,本技术方案如下:
第一方面,本申请实施例提供了一种关系三元组的生成方法,包括以下步骤:
获取输入文本对应的表示编码;
从所述表示编码中识别出候选主体;
判断所述表示编码中是否存在与所述候选主体具有目标语义关系的客体;
若存在,根据所述候选主体、所述语义关系及所述客体,生成关系三元组。
可选地,所述获取输入文本对应的表示编码,包括:
获取输入文本;
通过BERT编码器对所述输入文本进行编码,生成所述输入文本对应的表示编码。
可选地,所述判断所述表示编码中是否存在于所述候选主体具有语义关系的客体之后,还包括:
若不存在,确定所述候选主体无法基于所述目标语义关系构成关系三元组。
可选地,所述从所述表示编码中识别出候选主体,包括:
使用主体标注器从所述表示编码中识别出多个候选主体;
所述判断所述表示编码中是否存在与所述候选主体具有目标语义关系的客体,包括:
判断所述表示编码中是否存在与各所述候选主体具有语义关系的各客体;
所述若存在,根据所述候选主体、所述语义关系及所述客体,生成关系三元组,包括:
若存在,根据各所述候选主体、所述语义关系及各所述客体,生成至少一个关系三元组。
可选地,所述判断所述表示编码中是否存在与所述候选主体具有目标语义关系的客体,包括:
使用目标语义关系对应的客体标注器,判断所述表示编码中是否存在与所述候选主体具有所述目标语义关系的客体。
可选地,所述使用目标语义关系对应的客体标注器,判断所述表示编码中是否存在与所述候选主体具有所述目标语义关系的客体,包括:
使用多个客体标注器,并行判断所述表示编码中是否存在与所述候选主体具有目标语义关系的客体,所述多个客体标注器中的每个客体标注器对应于不同的目标语义关系。
可选地,所述使用目标语义关系对应的客体标注器,判断所述表示编码中是否存在与所述候选主体具有所述目标语义关系的客体,包括:
使用目标语义关系对应的客体标注器,基于所述表示编码中各目标词的编码表示及所述候选主体的编码表示,计算所述各目标词对应于客体起始位置的概率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010596226.8/2.html,转载请声明来源钻瓜专利网。





