[发明专利]实体关系提取方法有效

专利信息
申请号: 201810639503.1 申请日: 2018-06-20
公开(公告)号: CN108959474B 公开(公告)日: 2021-12-28
发明(设计)人: 贾维嘉;张新松;李鹏帅;刘天一 申请(专利权)人: 上海交通大学
主分类号: G06F16/35 分类号: G06F16/35;G06F16/36
代理公司: 上海思微知识产权代理事务所(普通合伙) 31237 代理人: 屈蘅
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 实体 关系 提取 方法
【权利要求书】:

1.一种实体关系提取方法,其特征在于,包括:

根据实体的描述信息标注数据集中的负样本,以将所述负样本划分为真正的负样本和无法确定的样本;

赋予所述无法确定的样本关系标签,以构造新的训练集;

根据双向门控循环单元对新的训练集进行关系特征提取,以获得实体关系;

其中,所述赋予所述无法确定的样本关系标签的方法包括:第一方法或者第二方法;

所述第一方法包括:根据对抗生成网络的生成模型给所述无法确定的样本生成关系标签;

根据对抗生成网络的判别模型判断所述关系标签的真伪,并将真的关系标签赋予所述无法确定的样本;

训练所述生成模型和所述判别模型的性能使两者性能都达到最优,所采用的优化公式如下:

G代表生成模型,D代表判别模型,Pdata(x)描述真的关系标签分布;Pc(c)描述生成的关系标签的分布;

所述第二方法包括:根据实体的类型信息推断实体对的关系,并将所有推断结果构建为候选关系;

计算所述候选关系的损失函数,最大化整个候选关系的可能概率优化整个关系特征提取网络,以确定最佳的实体对的关系;

根据最佳的实体对的关系给所述无法确定的样本生成关系标签。

2.如权利要求1所述的实体关系提取方法,其特征在于,当采用第二方法时,所述计算所述候选关系的损失函数采用如下公式:

J(θ)=αJtruth(θ)+βJgen(θ);

其中,其中,Jtruth是真的关系标签数据的损失函数,Jgen是生成的关系标签数据的损失函数,J是最终的损失函数。

3.如权利要求1~2中任一项所述的实体关系提取方法,其特征在于,所述负样本为:实体的描述信息中没有互相包含名字的实体对。

4.如权利要求3所述的实体关系提取方法,其特征在于,根据实体的描述信息标注数据集中的负样本后,标注后的数据集包括正样本、真正的负样本和无法确定的样本。

5.如权利要求4所述的实体关系提取方法,其特征在于,所述数据集为标准数据集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810639503.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top