[发明专利]问答匹配方法及模型训练方法、装置、设备、存储介质有效
| 申请号: | 201911285731.4 | 申请日: | 2019-12-13 |
| 公开(公告)号: | CN111046158B | 公开(公告)日: | 2020-12-15 |
| 发明(设计)人: | 闫昭;张士卫 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王姗姗;张颖玲 |
| 地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 问答 匹配 方法 模型 训练 装置 设备 存储 介质 | ||
本申请实施例提供一种问答匹配方法及模型训练方法、装置、设备、存储介质,其中,方法包括:获取问答匹配文档对应的第一词序列,所述问答匹配文档包括待解答的问题和用于匹配所述问题答案的文本,所述第一词序列中包括至少两个词,每一词包括一个或多个字;在所述第一词序列中,确定用于设置字符的目标位置;在所述目标位置设置用于表征答案类型的字符,形成第二词序列;在所述第二词序列中,确定与所述问题对应的答案的开始位置和结束位置;根据所述开始位置和所述结束位置在所述第二词序列中对应的内容,确定对应问题匹配的答案。通过本申请,能够支持多答案类型的机器阅读理解任务,从而满足用户对多答案类型的需求,提高用户体验。
技术领域
本申请实施例涉及人工智能技术领域,涉及但不限于一种问答匹配方法及模型训练方法、装置、设备、存储介质。
背景技术
随着人工智能技术的发展,机器阅读理解技术也得到了大量的应用,例如,在网页搜索、问答机器人和智能语音助手等多个应用场景下,都会使用到机器阅读理解技术。通常情况下,机器阅读理解时的答案输出包括多种类型,例如,片段型、是否型和无答案类型。
目前的机器阅读理解技术通常为抽取式机器阅读理解技术,即在用于匹配问题答案的文本中抽取一部分内容作为问题的答案。目前的机器阅读理解技术仅能支持文本片段型这一种答案类型作为输出,无法应对真实场景下用户对多答案类型的需求,用户体验较差。
发明内容
本申请实施例提供一种问答匹配方法及模型训练方法、装置、设备、存储介质,能够支持多答案类型的机器阅读理解任务,从而满足用户对多答案类型的需求,提高用户体验。
本申请实施例的技术方案是这样实现的:
本申请实施例提供一种问答匹配方法,包括:
获取问答匹配文档对应的第一词序列,所述问答匹配文档包括待解答的问题和用于匹配所述问题答案的文本,所述第一词序列中包括至少两个词,每一词包括一个或多个字;
在所述第一词序列中,确定用于设置字符的目标位置;
在所述目标位置设置用于表征答案类型的字符,形成第二词序列;
在所述第二词序列中,确定与所述问题对应的答案的开始位置和结束位置;
根据所述开始位置和所述结束位置在所述第二词序列中对应的内容,确定对应问题匹配的答案。
本申请实施例提供一种问答匹配网络模型训练方法,包括:
将样本数据中的待解答的问题、用于匹配所述问题答案的文本和字符,输入至特征提取网络模型中,对应得到与所述问题和所述文本对应的词特征向量、和与所述字符对应的字符特征向量;
将所述词特征向量和所述字符特征向量分别输入至答案位置预测网络模型中,得到与所述问题对应的答案的开始位置和结束位置;
将所述开始位置和所述结束位置输入至预设损失模型中,得到损失结果;
根据所述损失结果,对所述答案位置预测网络模型进行修正,得到所述问答匹配网络模型。
本申请实施例提供一种问答匹配装置,包括:
获取模块,用于获取问答匹配文档对应的第一词序列,所述问答匹配文档包括待解答的问题和用于匹配所述问题答案的文本,所述第一词序列中包括至少两个词,每一词包括一个或多个字;
第一确定模块,用于在所述第一词序列中,确定用于设置字符的目标位置;
设置模块,用于在所述目标位置设置用于表征答案类型的字符,形成第二词序列;
第二确定模块,用于在所述第二词序列中,确定与所述问题对应的答案的开始位置和结束位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911285731.4/2.html,转载请声明来源钻瓜专利网。





