[发明专利]实体关系提取方法有效
| 申请号: | 201810639503.1 | 申请日: | 2018-06-20 |
| 公开(公告)号: | CN108959474B | 公开(公告)日: | 2021-12-28 |
| 发明(设计)人: | 贾维嘉;张新松;李鹏帅;刘天一 | 申请(专利权)人: | 上海交通大学 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/36 |
| 代理公司: | 上海思微知识产权代理事务所(普通合伙) 31237 | 代理人: | 屈蘅 |
| 地址: | 200240 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实体 关系 提取 方法 | ||
1.一种实体关系提取方法,其特征在于,包括:
根据实体的描述信息标注数据集中的负样本,以将所述负样本划分为真正的负样本和无法确定的样本;
赋予所述无法确定的样本关系标签,以构造新的训练集;
根据双向门控循环单元对新的训练集进行关系特征提取,以获得实体关系;
其中,所述赋予所述无法确定的样本关系标签的方法包括:第一方法或者第二方法;
所述第一方法包括:根据对抗生成网络的生成模型给所述无法确定的样本生成关系标签;
根据对抗生成网络的判别模型判断所述关系标签的真伪,并将真的关系标签赋予所述无法确定的样本;
训练所述生成模型和所述判别模型的性能使两者性能都达到最优,所采用的优化公式如下:
G代表生成模型,D代表判别模型,Pdata(x)描述真的关系标签分布;Pc(c)描述生成的关系标签的分布;
所述第二方法包括:根据实体的类型信息推断实体对的关系,并将所有推断结果构建为候选关系;
计算所述候选关系的损失函数,最大化整个候选关系的可能概率优化整个关系特征提取网络,以确定最佳的实体对的关系;
根据最佳的实体对的关系给所述无法确定的样本生成关系标签。
2.如权利要求1所述的实体关系提取方法,其特征在于,当采用第二方法时,所述计算所述候选关系的损失函数采用如下公式:
J(θ)=αJtruth(θ)+βJgen(θ);
其中,其中,Jtruth是真的关系标签数据的损失函数,Jgen是生成的关系标签数据的损失函数,J是最终的损失函数。
3.如权利要求1~2中任一项所述的实体关系提取方法,其特征在于,所述负样本为:实体的描述信息中没有互相包含名字的实体对。
4.如权利要求3所述的实体关系提取方法,其特征在于,根据实体的描述信息标注数据集中的负样本后,标注后的数据集包括正样本、真正的负样本和无法确定的样本。
5.如权利要求4所述的实体关系提取方法,其特征在于,所述数据集为标准数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810639503.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种信息搜索方法及系统
- 下一篇:客户端角标、数据实时更新的方法





