[发明专利]一种阅读理解问答方法、装置、设备及存储介质在审
申请号: | 202210077920.8 | 申请日: | 2022-01-24 |
公开(公告)号: | CN114428843A | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 樊乘源;刘海锋 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/35;G06F40/35;G06K9/62 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 姚文娴;吴素花 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 阅读 理解 问答 方法 装置 设备 存储 介质 | ||
1.一种阅读理解问答方法,其特征在于,所述方法包括:
获取第一问题,以及答复所述第一问题的第一文本;
将所述第一问题和所述第一文本输入阅读理解模型,得到答复所述第一问题的第二文本;其中,所述第二文本的长度小于所述第一文本的长度;
所述阅读理解模型配置成:
判断所述第一问题的答案是否包含在所述第一文本中;
确定所述第一问题的答案包含在所述第一文本中,从所述第一文本中抽取所述第一问题的答案,得到所述第二文本。
2.根据权利要求1所述的方法,其特征在于,所述判断所述第一问题的答案是否包含在所述第一文本中,包括:
对所述第一问题和所述第一文本进行语言处理,得到语言处理结果;
基于所述语言处理结果中第一输出向量,判断所述第一问题的答案是否包含在所述第一文本中;
其中,所述第一输出向量为表示所述第一问题与所述第一文本之间语义关系的向量。
3.根据权利要求2所述的方法,其特征在于,所述基于所述语言处理结果中第一输出向量,判断所述第一问题的答案是否包含在所述第一文本中,包括:
对所述第一输出向量进行分类处理,得到分类结果;
所述分类结果为1时,确定所述第一问题的答案包含在所述第一文本中;
所述分类结果为0时,确定所述第一问题的答案不包含在所述第一文本中。
4.根据权利要求2所述的方法,其特征在于,所述从所述第一文本中抽取所述第一问题的答案,包括:
基于所述语言处理结果中多个第二输出向量,从所述第一文本中抽取所述第一问题的答案;
其中,所述第二输出向量为所述第一问题中任意文字对应的融合所述第一问题整体语义信息后的向量表示,或者为所述第一文本中任意文字对应的融合所述第一文本整体语义信息后的向量表示。
5.根据权利要求4所述的方法,其特征在于,所述基于所述语言处理结果中多个第二输出向量,从所述第一文本中抽取所述第一问题的答案,包括:
对所述第一问题和所述第一文本进行词法分析处理,得到所述第一问题和所述第一文本整体对应的分词结果,及所述分词结果中分词的词性标注结果;
基于预设向量编码方式和所述词性标注结果对所述分词结果进行编码,得到使用向量表示的编码结果;
基于所述编码结果和所述多个第二输出向量,从所述第一文本中抽取所述第一问题的答案。
6.根据权利要求5所述的方法,其特征在于,所述基于预设向量编码方式和所述词性标注结果对所述分词结果进行编码,包括:
根据词性重要程度和所述词性标注结果,将所述分词结果中每个分词的字符串转化为数值,得到所述第一问题和所述第一文本整体对应的的词性特征;
按照所述预设向量编码方式对所述词性特征进行编码,得到使用向量表示的编码结果。
7.根据权利要求5所述的方法,其特征在于,所述基于所述编码结果和所述多个第二输出向量,从所述第一文本中抽取所述第一问题的答案,包括:
将所述编码结果与所述多个第二输出向量进行拼接,得到拼接结果;
基于所述拼接结果从所述第一文本中抽取所述第一问题的答案。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取第二问题,以及答复所述第二问题的第三文本;其中,所述第三文本为包含所述第二问题的答案的文本,或者为不包含所述第二问题的答案的文本;
将所述第二问题和所述第三文本输入预设阅读理解模型,生成所述第二问题的预测答案;
基于所述预测答案与真实答案确定损失函数;
基于所述损失函数调整所述预设阅读理解模型的模型参数,得到训练好的阅读理解模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210077920.8/1.html,转载请声明来源钻瓜专利网。