[发明专利]一种事件识别模型的训练方法和装置有效
申请号: | 201811535981.4 | 申请日: | 2018-12-14 |
公开(公告)号: | CN109670174B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 刘树林 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/284 | 分类号: | G06F40/284;G06F40/295;G06N3/04;G06N3/08 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 事件 识别 模型 训练 方法 装置 | ||
1.一种事件识别模型的训练方法,其特征在于,包括:
从训练数据库中获取到目标事件类型和第一文本样本,并将所述目标事件类型和所述第一文本样本输入到初始的事件识别模型中,所述事件识别模型中配置有注意力层;
所述将所述目标事件类型和所述第一文本样本输入到初始的事件识别模型中,包括:根据所述目标事件类型查询词向量表,得到第一事件类型向量和第二事件类型向量,所述第一事件类型向量为局部信息建模向量,所述第二事件类型向量为全局信息建模向量;从所述第一文本样本中识别出每个词对应的命名实体类型,并将所述每个词以及所述每个词对应的命名实体类型转换为词样本向量;将所述第一事件类型向量、所述第二事件类型向量和所述词样本向量输入到所述事件识别模型中;
通过所述事件识别模型对所述词样本向量进行表示信息提取,得到所述第一文本样本中每个词对应的词表示向量;通过所述注意力层获取所述第一文本样本中每个词对应的词表示向量和所述第一事件类型向量之间的关注度信息;
按照所述第一文本样本中每个词对应的词表示向量和所述第一事件类型向量之间的关注度信息,对所述第一文本样本中每个词对应的词表示向量进行加权平均计算,得到所述第一文本样本对应的文本表示向量;根据所述第一文本样本对应的文本表示向量和所述第一事件类型向量获取所述第一文本样本的局部信息;根据所述第一文本样本中最后一个输入所述事件识别模型的词表示向量和所述第二事件类型向量获取所述第一文本样本的全局信息;对所述第一文本样本的局部信息和所述第一文本样本的全局信息进行加权平均计算,得到所述第一文本样本与所述目标事件类型的关联结果;
根据所述事件识别模型输出的所述关联结果,采用预设的损失函数对所述事件识别模型进行训练。
2.根据权利要求1所述的方法,其特征在于,所述从所述第一文本样本中识别出每个词对应的命名实体类型,并将所述每个词以及所述每个词对应的命名实体类型转换为词样本向量,包括:
对所述第一文本样本进行分词处理从而得到词序列,所述词序列包括多个词;
对所述词序列中的每个词分别进行命名实体识别,得到所述每个词对应的命名实体类型;
将所述每个词转换为相应的词向量,并将所述每个词对应的命名实体类型转换为相应的命名实体类型向量;
将所述每个词对应的词向量和命名实体类型向量拼接在一起,得到所述词样本向量。
3.根据权利要求1所述的方法,其特征在于,所述通过所述事件识别模型对所述词样本向量进行表示信息提取,得到所述第一文本样本中每个词对应的词表示向量,包括:
通过所述事件识别模型中提取到所述第一文本样本中第t-1个词对应的词表示向量之后,将所述第一文本样本中第t个词对应的词样本向量输入到所述事件识别模型中,所述t为大于或等于1的正整数;
根据所述第一文本样本中第t-1个词对应的词表示向量,通过所述事件识别模型对所述第一文本样本中第t个词对应的词样本向量进行表示信息提取,得到所述第一文本样本中第t个词对应的词表示向量。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述将所述目标事件类型和所述第一文本样本输入到初始的事件识别模型中,包括:
当所述训练数据库中提取到N个所述目标事件类型时,获取N个二元组,其中,每个二元组包括:N个所述目标事件类型的一个目标事件类型和所述第一文本样本,所述N的取值为大于或等于2的正整数;
将所述N个二元组分别输入到所述事件识别模型中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811535981.4/1.html,转载请声明来源钻瓜专利网。