[发明专利]遥监督关系抽取模型的训练方法及相关装置在审
| 申请号: | 202011355553.0 | 申请日: | 2020-11-27 |
| 公开(公告)号: | CN112329463A | 公开(公告)日: | 2021-02-05 |
| 发明(设计)人: | 崔宇浩;金忠孝 | 申请(专利权)人: | 上海汽车集团股份有限公司;上海汽车工业(集团)总公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F40/216;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 王会会 |
| 地址: | 201203 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 监督 关系 抽取 模型 训练 方法 相关 装置 | ||
1.一种遥监督关系抽取模型的训练方法,其特征在于,所述遥监督关系抽取模型包括词嵌入层、特征提取层和输出层,所述特征提取层包括循环层和卷积层,所述输出层包括袋级最大池层和softmax层,所述训练方法包括:
对于每个实体关系,将与其对应的正样本打包成至少一个句袋,并将与其对应的负样本打包成至少一个句袋;
对于每个句袋,对所述句袋中的每个句子加入实体定位符,并进行分词和向量化,得到句袋索引向量;
将所述句袋索引向量输入到所述词嵌入层,得到所述词嵌入层输出的句袋词向量;
将所述句袋词向量输入到所述特征提取层,得到所述特征提取层输出的语义特征;
将所述语义特征输入到所述输出层,得到所述输出层输出的实体关系的预测概率;
比较所述预测概率与句袋代表的实体关系,并计算损失以及更新模型参数。
2.根据权利要求1所述的遥监督关系抽取模型的训练方法,其特征在于,所述循环层,具体为:
长短期记忆人工神经网络。
3.根据权利要求1所述的遥监督关系抽取模型的训练方法,其特征在于,在所述将正样本按照实体关系类别打包成代表各实体关系的句袋,并将负样本依照大小分成若干句袋之前,还包括:
从知识库中提取实体关系;
对于每个所述实体关系,从样本中抽取包含所述实体关系的实体对的句子作为所述实体关系的正样本;
对于每个所述实体关系,从样本中抽取未包含所述实体关系的实体对的句子作为所述实体关系的负样本。
4.根据权利要求1所述的遥监督关系抽取模型的训练方法,其特征在于,还包括:
利用测试集,对遥监督关系抽取模型进行测试的过程。
5.一种遥监督关系抽取模型的训练装置,其特征在于,所述遥监督关系抽取模型包括词嵌入层、特征提取层和输出层,所述特征提取层包括循环层和卷积层,所述输出层包括袋级最大池层和softmax层,所述训练装置包括:
句袋生成单元,用于对于每个实体关系,将与其对应的正样本打包成至少一个句袋,并将与其对应的负样本打包成至少一个句袋;
句袋索引向量单元,用于对于每个句袋,对所述句袋中的每个句子加入实体定位符,并进行分词和向量化,得到句袋索引向量;
矩阵形成单元,用于将所述句袋索引向量输入到所述词嵌入层,得到所述词嵌入层输出的句袋词向量;
语义特征提取单元,用于将所述句袋词向量输入到所述特征提取层,得到所述特征提取层输出的语义特征;
预测单元,用于将所述语义特征输入到所述输出层,得到所述输出层输出的实体关系的预测概率;
更新单元,用于比较所述预测概率与句袋代表的实体关系,并计算损失以及更新模型参数。
6.根据权利要求5所述的遥监督关系抽取模型的训练装置,其特征在于,所述循环层,具体为:
长短期记忆人工神经网络。
7.根据权利要求5所述的遥监督关系抽取模型的训练装置,其特征在于,还包括:
实体关系提取单元,用于从知识库中提取实体关系;
正样本单元,用于对于每个所述实体关系,从样本中抽取包含所述实体关系的实体对的句子作为所述实体关系的正样本;
负样本单元,用于对于每个所述实体关系,从样本中抽取未包含所述实体关系的实体对的句子作为所述实体关系的负样本。
8.根据权利要求5所述的遥监督关系抽取模型的训练装置,其特征在于,还包括:
模型测试单元,用于利用测试集,对遥监督关系抽取模型进行测试。
9.一种可读存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时,实现如权利要求1~4中任一项所述的遥监督关系抽取模型的训练方法的各个步骤。
10.一种遥监督关系抽取模型的训练设备,包括存储器和处理器,其特征在于,所述存储器,用于存储程序;
所述处理器,用于执行所述程序,实现如权利要求1~4中任一项所述的遥监督关系抽取模型的训练方法的各个步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海汽车集团股份有限公司;上海汽车工业(集团)总公司,未经上海汽车集团股份有限公司;上海汽车工业(集团)总公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011355553.0/1.html,转载请声明来源钻瓜专利网。





