[发明专利]一种智能问答的优化方法及装置、存储介质、终端在审
申请号: | 202210248099.1 | 申请日: | 2022-03-14 |
公开(公告)号: | CN114610853A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 谯轶轩 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F40/35;G06K9/62 |
代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
地址: | 518000 广东省深圳市福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 问答 优化 方法 装置 存储 介质 终端 | ||
1.一种智能问答的优化方法,其特征在于,包括:
接收待回答问题并计算与所述待回答问题对应的问题向量,所述问题向量为包含所述待回答问题的语义信息的向量;
获取预设短语库中的多个短语向量,各个所述短语向量为包含短语对应的上下文语义信息的向量;
基于所述问题向量和所述短语向量,利用预先训练的问答模型计算短语与所述待回答问题之间的匹配概率,所述匹配概率用于标识所述短语作为所述待回答问题的答案的匹配程度;
根据所述匹配概率输出所述待回答问题的答案。
2.根据权利要求1所述的方法,其特征在于,所述获取预设短语库中的多个短语向量之前,所述方法还包括:
获取文本库中的多个文章并按照短语粒度将各个所述文章进行划分,得到多个短语,每个短语在所属文章中对应有起始位置和结束位置;
将各个所述文章按照字符粒度输入第一BERT模型进行计算,得到多个字符向量;
根据所述起始位置对应的起始字符向量和所述结束位置对应的结束字符向量进行拼接,得到所述短语的短语向量;
基于所述多个文章包含的短语对应的短语向量生成所述预设短语库。
3.根据权利要求1所述的方法,其特征在于,所述接收待回答问题并计算与所述待回答问题对应的问题向量之前,所述方法还包括:
获取样本问题和样本问题答案;
提取样本向量集合,所述样本向量集合中包含有多个样本字符向量,且各个所述样本字符向量为基于所述样本问题答案所属文章生成的;
将所述样本问题依次输入第二BERT模型和第三BERT模型进行计算,分别得到问题起始向量和问题结束向量;
利用所述起始向量和所述问题结束向量进行拼接,得到样本问题向量;
根据所述样本问题向量和所述样本字符向量集合训练所述问答模型。
4.根据权利要求3所述的方法,其特征在于,所述根据所述样本问题向量和所述样本字符向量集合训练所述问答模型包括:
计算所述问题起始向量与所述样本字符向量集合中各个字符向量之间的第一向量内积,和计算所述问题结束向量与所述样本字符向量集合中各个字符向量之间的第二向量内积;
利用预置函数将所述第一向量内积和所述第二向量内积转换为第一概率和第二概率,所述第一概率用于标识字符为所述样本问题答案起始位置的概率,所述第二概率用于标识字符为所述样本问题答案结束位置的概率;
根据所述样本问题答案的实际位置、所述第一概率和所述第二概率调整模型参数,并得到所述问答模型。
5.根据权利要求4所述的方法,其特征在于,在得到所述问答模型之后,所述方法还包括:
根据所述第一概率和所述第二概率分别计算第一损失函数和第二损失函数;
根据所述第一损失函数和所述第二损失函数调整所述模型参数。
6.根据权利要求3所述的方法,其特征在于,所述接收待回答问题并计算与所述待回答问题对应的问题向量包括:
接收待回答问题并根据所述第二BERT模型和第三BERT模型分别计算与所述待回答问题对应的问题起始向量和问题结束向量;
利用所述与所述待回答问题对应的问题起始向量和问题结束向量进行拼接,得到所述待回答问题对应的问题向量。
7.根据权利要求1所述的方法,其特征在于,所述根据所述匹配概率输出所述待回答问题的答案包括:
将所述匹配概率按照降序进行排序并提取预设排序范围内的多个匹配概率;
将所述预设排序范围内的多个匹配概率分别对应的短语确定为所述待回答问题的答案并输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210248099.1/1.html,转载请声明来源钻瓜专利网。