[发明专利]基于头实体预测的实体和关系联合抽取方法有效
申请号: | 202010589302.2 | 申请日: | 2020-06-24 |
公开(公告)号: | CN111832293B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 陈彦如;王浩;陈硕;石静;高明珠;林幼玲;宋岱松;邹可欣;陈良银 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F40/216 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610065 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 实体 预测 关系 联合 抽取 方法 | ||
1.基于头实体预测的实体和关系联合抽取方法,其特征在于:
第一步,针对输入的内容通过BERT层对其进行编码,然后再通过Bi-LSTM层得到每个标签的概率,通过CRF得到最佳的标签序列,从而识别出头实体;
第二步,遍历第一步中识别出的每个头实体,取其平均向量与原编码向量相加,然后作为尾实体标注的输入;
第三步,尾实体识别和关系识别,采用与头实体识别同样的模型结构,但是采用不同的标注策略,即将关系融入到尾实体中,进而在识别出尾实体的同时识别出关系,从而得到三元组。
2.如权利要求1所述的基于头实体预测的实体和关系联合抽取方法,其特征在于:将实体和关系抽取任务转化为头实体标注和尾实体标注的两个序列标注任务的方法。
3.如权利要求1所述的基于头实体预测的实体和关系联合抽取方法,其特征在于:将实体和关系抽取任务转化为头实体标注和尾实体标注的两个序列标注任务后,即通过将关系只融入到头实体中,或者只融入到尾实体中的方法。
4.如权利要求1所述的基于头实体预测的实体和关系联合抽取方法,其特征在于:在进行实体和关系抽取时,将实体和关系抽取任务转化为头实体标注和尾实体标注的两个序列标注任务后,将实体间的关系只融入到尾实体中的方法,在进行序列标注识别尾实体的时候同时得到关系。
5.如权利要求1所述的基于头实体预测的实体和关系联合抽取方法,其特征在于:在实体和关系抽取中,将实体和关系抽取任务转化为头实体标注和尾实体标注的两个序列标注任务后,将第一步识别的头实体的向量的平均值作为第二步识别尾实体时的输入。
6.如权利要求1所述的基于头实体预测的实体和关系联合抽取方法,其特征在于:在训练的过程中,采取的负采样的方法,将尾实体向量代替头实体的向量作为第二阶段的输入时,此时对应的标注标签全为“o”标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010589302.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种远程水位识别RTU
- 下一篇:组合式计量称重装置