[发明专利]基于语音语义的信息检索方法、装置及计算机设备有效
申请号: | 202011182344.0 | 申请日: | 2020-10-29 |
公开(公告)号: | CN112287069B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 郝新东 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F16/335;G06F40/295;G06N3/0464;G06N3/08 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语音 语义 信息 检索 方法 装置 计算机 设备 | ||
1.一种基于语音语义的信息检索方法,其特征在于,包括下述步骤:
获取匹配语句对以及候选语句;
删除所述候选语句中的实体得到无实体语句;
将所述匹配语句对设置为正样本,并将所述候选语句及所述无实体语句设置为负样本;
根据所述正样本和所述负样本对基于注意力机制的初始语句匹配模型进行训练,得到语句匹配模型;
获取用户问句;
通过所述语句匹配模型在预设的问答库中确定与所述用户问句匹配的库存问句,并展示所述库存问句的答案信息,其中,所述预设的问答库中存储有多个预设的库存问句以及与所述库存问句对应的答案信息;
所述根据所述正样本和所述负样本对基于注意力机制的初始语句匹配模型进行训练,得到语句匹配模型的步骤包括:
给所述正样本和所述负样本添加样本标签,得到训练样本;
分别生成所述训练样本中第一语句的第一词向量矩阵和第二语句的第二词向量矩阵;
基于所述注意力机制,对所述第一词向量矩阵和第二词向量矩阵进行交互计算,得到第一注意力特征矩阵和第二注意力特征矩阵;
将所述第一词向量矩阵和所述第一注意力特征矩阵进行矩阵融合得到第一融合矩阵,以及将所述第二词向量矩阵和所述第二注意力特征矩阵进行矩阵融合得到第二融合矩阵;
通过所述初始语句匹配模型对所述第一融合矩阵和第二融合矩阵进行处理,得到所述第一语句和所述第二语句的特征向量;
对所述特征向量进行计算,得到所述训练样本语句间的相似度;
根据所述相似度和所述样本标签计算模型损失;
基于所述模型损失调整所述初始语句匹配模型的模型参数,直至模型收敛,得到所述语句匹配模型。
2.根据权利要求1所述的基于语音语义的信息检索方法,其特征在于,负样本的构造方法还包括:
获取预设的每个实体的库存问句,其中,针对所述每个实体的库存问句中均包括若干类相似库存问句,其中,所述相似库存问句为语义相同但结构不同的库存问句;
对所述每个实体的若干类相似库存问句进行随机组合,并将组合后的库存问句对设置为负样本;
对不同实体的库存问句进行随机组合,并将组合后的库存问句对设置为负样本。
3.根据权利要求1所述的基于语音语义的信息检索方法,其特征在于,所述获取用户问句的步骤包括:
获取初始用户问句;
根据预设热词表对所述初始用户问句进行分词,并通过预设词典对分词后的初始用户问句进行编码,得到第一编码;
将所述第一编码输入至训练完毕的文本纠正模型,得到第二编码;
根据所述预设词典对所述第二编码进行解码,得到所述用户问句。
4.根据权利要求1所述的基于语音语义的信息检索方法,其特征在于,所述通过所述语句匹配模型在预设的问答库中确定与所述用户问句匹配的库存问句,并展示所述库存问句的答案信息的步骤包括:
通过所述语句匹配模型计算所述用户问句与预设的问答库中库存问句的相似度;
根据计算得到的相似度选取与所述用户问句匹配的库存问句;
将选取的库存问句所对应的答案信息发送至终端进行展示。
5.根据权利要求4所述的基于语音语义的信息检索方法,其特征在于,所述通过所述语句匹配模型计算所述用户问句与预设的问答库中库存问句的相似度的步骤包括:
识别所述用户问句中的问句实体;
根据所述问句实体对预设的问答库中的库存问句进行筛选;
通过所述语句匹配模型计算所述用户问句与筛选到的库存问句的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011182344.0/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置