[发明专利]代词消解方法、装置、电子设备及存储介质有效
申请号: | 202110283477.5 | 申请日: | 2021-03-17 |
公开(公告)号: | CN112765958B | 公开(公告)日: | 2023-07-04 |
发明(设计)人: | 祝大伟;陈立 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F40/295 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 代词 消解 方法 装置 电子设备 存储 介质 | ||
1.一种代词消解方法,其特征在于,所述方法包括:
获取对话数据,划分所述对话数据中的上下文语句;
标记所述上下文语句中实体及代词的对应关系,生成标准实体-代词对应关系;
利用代词实体消解模型中的编码层对所述上下文语句中字符进行位置索引编码,得到上下文字符位置索引;利用所述编码层将所述上下文语句中字符转换成对应的字符向量,得到初始上下文字符向量;将所述上下文字符位置索引和所述初始上下文字符向量进行组合,生成上下文字符向量;
利用所述代词实体消解模型中的前馈注意力机制对所述上下文字符向量进行特征序列提取,得到上下文特征字符向量;
利用所述代词实体消解模型中的实体-代词关系消解模块中的全连接层检测所述上下文特征字符词向量中的代词实体位置信息,利用所述实体-代词关系消解模块中的激活函数输出所述代词实体位置信息,得到预测实体-代词对应关系;
利用所述代词实体消解模型中损失函数计算所述预测实体-代词对应关系与所述标准实体-代词对应关系的损失值;
当所述损失值不满足预设条件时,调整所述代词实体消解模型的参数,并返回利用代词实体消解模型中的编码层对所述上下文语句中字符进行位置向量编码的步骤及后续步骤;
当所述损失值满足预设条件时,得到训练完成的代词实体消解模型;
利用所述训练完成的代词实体消解模型对待消解实体-代词关系的对话数据进行实体-代词关系消解,得到消解结果。
2.如权利要求1所述的代词消解方法,其特征在于,所述划分所述对话数据中的上下文语句,包括:
获取所述对话数据的语句时间,根据所述语句时间,利用预设的上下文语句划分脚本对所述对话数据进行顺序语句标记,得到上下文语句。
3.如权利要求1所述的代词消解方法,其特征在于,所述标记所述上下文语句中实体及代词的对应关系,生成标准实体-代词对应关系,包括:
构建所述上下文语句的数据结构;
根据所述数据结构,利用预设的指针对所述上下文语句进行实体-代词对应关系标记,得到标准实体-代词对应关系。
4.如权利要求1所述的代词消解方法,其特征在于,所述利用代词实体消解模型中的编码层对所述上下文语句中字符进行位置索引编码和字符向量转换,生成上下文字符向量,包括:
利用所述编码层对所述上下文语句中字符进行索引编码,得到上下文字符位置索引;
利用所述编码层将所述上下文语句中字符转换成对应的字符向量,得到初始上下文字符向量;
将所述上下文字符位置索引和所述初始上下文字符向量进行组合,生成上下文字符向量。
5.如权利要求1所述的代词消解方法,其特征在于,所述利用所述代词实体消解模型中的前馈注意力机制对所述上下文字符向量本进行特征序列提取,得到上下文特征字符向量,包括:
利用所述前馈注意力机制中的自注意力模块查询所述上下文字符向量;
利用所述前馈注意力机制中的卷积模块对查询的所述上下文字符向量进行特征提取,得到特征字符向量;
利用所述前馈注意力机制中的编码器提取所述特征字符向量的信息序列,得到上下文特征字符向量。
6.如权利要求1中所述的代词消解方法,其特征在于,所述利用所述代词实体消解模型中的实体-代词关系消解模块中的全连接层检测所述上下文特征字符词向量中的代词实体位置信息,包括:
利用下述方法检测所述上下文特征字符词向量中的代词实体位置信息:
其中,表示代词实体位置信息,s表示上下文特征字符词向量,e表示无限不循环小数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110283477.5/1.html,转载请声明来源钻瓜专利网。