[发明专利]一种答案文本的获取方法及装置、计算机设备和存储介质在审
| 申请号: | 202110662968.0 | 申请日: | 2021-06-15 |
| 公开(公告)号: | CN113821609A | 公开(公告)日: | 2021-12-21 |
| 发明(设计)人: | 刘艾婷 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06F40/279;G06F40/30;G06N20/00 |
| 代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 聂秀娜 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 答案 文本 获取 方法 装置 计算机 设备 存储 介质 | ||
1.一种答案文本的获取方法,其特征在于,包括:
获取目标问题文本以及待匹配文本,其中,所述待匹配文本包括多个文本单元;
根据所述目标问题文本确定目标文本类别,其中,目标文本类别表示与所述目标问题文本关联的问题类型;
根据所述目标问题文本、所述待匹配文本以及所述目标文本类别,获取每个文本单元所对应的第一概率与所述每个文本单元所对应的第二概率,其中,所述第一概率表示文本单元作为答案文本开始位置的概率,所述第二概率表示文本单元作为答案文本结束位置的概率;
根据所述每个文本单元所对应的第一概率,以及所述每个文本单元所对应的第二概率,从所述待匹配文本中确定与所述目标问题文本对应的目标答案文本。
2.根据权利要求1所述的方法,其特征在于,所述根据所述目标问题文本、所述待匹配文本以及所述目标文本类别,获取每个文本单元所对应的第一概率与所述每个文本单元所对应的第二概率,包括:
根据所述目标问题文本、所述待匹配文本以及所述目标文本类别生成目标文本序列,其中,所述目标文本序列包括所述目标问题文本的文本序列,所述待匹配文本的文本序列以及所述目标文本类别的文本序列;
对所述目标文本序列进行编码处理,得到所述目标文本序列的特征信息;
根据所述目标文本序列的特征信息,获取所述每个文本单元所对应的第一概率与所述每个文本单元所对应的第二概率。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标问题文本、所述待匹配文本以及所述目标文本类别生成目标文本序列,包括:
对所述目标问题文本进行分词处理,得到所述目标问题文本的文本序列;
对所述待匹配文本进行分词处理,得到所述待匹配文本的文本序列;
对所述目标文本类别进行分词处理,得到所述目标文本类别的文本序列;
对所述目标问题文本的文本序列、所述待匹配文本的文本序列以及所述目标文本类别的文本序列进行拼接处理,得到所述目标文本序列。
4.根据权利要求2所述的方法,其特征在于,所述对所述目标文本序列进行编码处理,得到所述目标文本序列的特征信息,包括:
对所述目标文本序列进行词嵌入处理,得到词向量集合;
基于所述词向量集合,通过K个堆栈层获取所述目标文本序列的特征信息,其中,所述K为大于1的整数。
5.根据权利要求4所述的方法,其特征在于,所述基于所述词向量集合,通过K个堆栈层获取所述目标文本序列的特征信息,包括:
针对于所述词向量集合中的每个词向量,基于第i个特征向量,通过第i个堆栈层输出第(i+1)个特征向量,直至得到第K个特征向量,其中,所述i为大于或等于1,且小于或等于所述K的整数;
根据所述词向量集合中的每个词向量的第K个特征向量,得到所述目标文本序列的特征信息。
6.根据权利要求2所述的方法,其特征在于,所述根据所述目标文本序列的特征信息,获取所述每个文本单元所对应的第一概率与所述每个文本单元所对应的第二概率,包括:
基于所述目标文本序列的特征信息,通过第一全连接层获取所述每个文本单元所对应的第一概率;
基于所述目标文本序列的特征信息,通过第二全连接层获取所述每个文本单元所对应的第二概率。
7.根据权利要求1所述的方法,其特征在于,所述根据所述每个文本单元所对应的第一概率,以及所述每个文本单元所对应的第二概率,从所述待匹配文本中确定与所述目标问题文本对应的目标答案文本,包括:
根据所述每个文本单元所对应的第一概率确定开始文本单元,其中,所述开始文本单元所对应的第一概率在所述待匹配文本包括的所有文本单元所对应的第一概率中最大;
根据所述每个文本单元所对应的第二概率确定结束文本单元,其中,所述结束文本单元所对应的第二概率在所述待匹配文本包括的所有文本单元所对应的第二概率中最大;
根据所述开始文本单元以及结束文本单元,在所述待匹配文本中确定所述目标问题文本对应的目标答案文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110662968.0/1.html,转载请声明来源钻瓜专利网。





