[发明专利]模型训练方法、问答实现方法、装置和计算设备在审
申请号: | 202110233770.0 | 申请日: | 2021-03-03 |
公开(公告)号: | CN113011197A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 卢健 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06F40/35 | 分类号: | G06F40/35 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 任默闻;孙乳笋 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 方法 问答 实现 装置 计算 设备 | ||
1.一种模型训练方法,包括:
将至少三个语句输入至语义表示模型,获得至少三个向量,所述至少三个语句包括至少两个用于表示第一语义的第一语句、以及至少一个用于表示第二语义的第二语句;
根据所述至少三个向量,确定损失函数的取值,所述损失函数用于表示第一相似度与第二相似度之间的偏差程度,所述第一相似度用于表示第一语句之间语义的相似程度,所述第二相似度用于表示第一语句与第二语句之间语义的相似程度;
根据损失函数的取值,确定所述语义表示模型的模型参数。
2.如权利要求1所述的方法,所述语义表示模型包括ERNIE模型;所述第一语句和所述第二语句为提问语句;所述第一语义和所述第二语义为提问语句的语义。
3.如权利要求1所述的方法,所述确定损失函数的取值,包括:
根据至少两个第一语句的向量,计算第一相似度;
根据第一语句的向量和第二语句的向量,计算第二相似度;
根据第一相似度和第二相似度,确定损失函数的取值。
4.如权利要求1或3所述的方法,所述将至少三个语句输入至语义表示模型,包括:
将三个语句输入至语义表示模型,获得三个向量,所述三个语句包括两个用于表示第一语义的第一语句、以及一个用于表示第二语义的第二语句;
根据公式Loss=max{similarity(V1,V3)-similarity(V1,V2)+α,0},确定损失函数的取值,其中,V1表示一个第一语句的向量,V2表示另一个第一语句的向量,V3表示第二语句的向量,similarity(V1,V2)表示第一相似度,similarity(V1,V3)表示第二相似度,α表示系数。
5.一种问答实现方法,包括:
将目标提问语句输入至语义表示模型,获得目标向量;
将目标向量输入至与所述语义表示模型相连的向量搜索模型,获得参考向量,所述参考向量为向量集中与所述目标向量之间的距离满足预设条件的向量,所述向量集包括问答知识库中提问语句的向量,所述问答知识库包括具有对应关系的提问语句和答复语句;
利用参考向量,基于所述问答知识库确定所述目标提问语句对应的答复语句。
6.如权利要求5所述的方法,所述语义表示模型包括ERNIE模型;
所述向量搜索模型包括HNSW模型。
7.如权利要求5所述的方法,所述问答知识库包括多个问答集,每个问答集包括至少一个提问语句、以及与所述至少一个提问语句相对应的答复语句;
所述基于所述问答知识库确定所述目标提问语句的答复语句,包括:
利用参考向量,从所述问答知识库中选取问答集;
根据选取的问答集,确定所述目标提问语句对应的答复语句。
8.如权利要求7所述的方法,所述参考向量的数量为多个,所述问答知识库中的每个问答集对应有标识;所述从所述问答知识库中选取问答集,包括:
针对每个参考向量,从所述问答知识库中选取包含参考向量所对应提问语句的问答集;
所述确定所述目标提问语句对应的答复语句,包括:
以选取的问答集对应的标识所形成的集合为标识集,从所述标识集中选取数量最多的标识,从选取的标识所对应的问答集中获取答复语句,作为所述目标提问语句对应的答复语句。
9.如权利要求5所述的方法,所述向量集通过如下方式获得:
将问答知识库中的提问语句输入至语义表示模型,获得向量;
将获得的向量计入所述向量集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110233770.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防尘圆柱产品表面抛光设备
- 下一篇:换挡机构及车辆