[发明专利]一种语音搜索方法、装置及电子设备有效
申请号: | 201710538452.9 | 申请日: | 2017-07-04 |
公开(公告)号: | CN107357875B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 符文君;吴友政 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/683 | 分类号: | G06F16/683;G10L17/00;G10L17/02;G10L25/54 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 搜索 方法 装置 电子设备 | ||
1.一种语音搜索方法,其特征在于,所述方法包括:
接收待识别语音;
对所述待识别语音进行意图识别,获得发出所述待识别语音的目标用户的搜索意图;
获得所述待识别语音的声纹特征,并将所述声纹特征作为待识别声纹特征;
通过所述待识别声纹特征识别所述目标用户;
基于所述目标用户,利用所述搜索意图进行搜索,获得搜索结果;
所述对所述待识别语音进行意图识别,获得发出所述待识别语音的目标用户的搜索意图的步骤,包括:
对所述待识别语音进行语音识别,获得目标文本信息;
将所述目标文本信息输入至预先训练的第一模型,获得目标意图标签序列,其中,所述第一模型是:采用样本语音的样本文本信息以及样本文本的意图标签标注信息对预设神经网络模型进行模型训练获得的;所述目标意图标签序列包括意图信息和意图类别;
根据所述目标意图标签序列,获得发出所述待识别语音的目标用户的搜索意图;
所述基于所述目标用户,利用所述搜索意图进行搜索,获得搜索结果,包括:
判断所述搜索意图是否存在所述目标用户的历史行为信息;
如果所述搜索意图存在所述目标用户的历史行为信息,利用所述搜索意图在用户历史行为场景数据库中记录的所述目标用户的历史行为场景数据中进行搜索,获得搜索结果;
如果所述搜索意图不存在所述目标用户的历史行为信息,利用所述搜索意图在服务器数据库中进行搜索,获得搜索结果,其中,所述服务器数据库用于存储待搜索资源的信息。
2.根据权利要求1所述的方法,其特征在于,所述通过所述待识别声纹特征识别所述目标用户的步骤,包括:
将所述待识别声纹特征输入至目标高斯混合模型,获得待识别初始声纹向量,根据所述待识别初始声纹向量计算获得待识别声纹向量,其中,所述目标高斯混合模型为:采用目标语音对预设高斯混合模型进行模型训练得到的模型;所述目标语音包括:上一次对所述预设高斯混合模型进行模型训练采用的语音、上一次对所述预设高斯混合模型进行模型训练后至本次对所述预设高斯混合模型进行模型训练之前需要进行语音识别的语音;
计算所述待识别声纹向量与发出目标语音的用户的声纹模型向量之间的相似度,其中,一个用户的声纹模型向量为根据该用户的初始声纹模型向量计算得到的,每一用户的初始声纹模型向量为:采用目标语音对所述预设高斯混合模型进行模型训练得到的输出向量;
判断计算得到的相似度是否全小于预设的阈值;
如果计算得到的相似度全小于预设的阈值,确定所述目标用户为新用户;
如果计算得到的相似度不全小于预设的阈值,确定所述目标用户为与所述待识别声纹向量相似度最大的声纹模型向量对应的用户。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
在计算得到的相似度全小于所述预设的阈值时,将所述待识别声纹向量确定为所述目标用户的声纹模型向量;
在计算得到的相似度不全小于所述预设的阈值时,若满足对所述预设高斯混合模型进行模型训练的条件,采用目标语音对所述预设高斯混合进行模型训练,获得初始声纹模型向量,并根据所获得的初始声纹向量计算得到发出目标语音的用户的声纹模型向量;若不满足对所述预设高斯混合模型进行模型训练的条件,存储所述待识别语音。
4.根据权利要求1所述的方法,其特征在于,在所述获得搜索结果后,所述方法还包括:
按照预设的排序方式对所获得的搜索结果进行排序。
5.根据权利要求4所述的方法,其特征在于,所述按照预设的排序方式对所获得的搜索结果进行排序,包括:
在所获得的搜索结果为在所述服务器数据库中进行搜索获得的搜索结果,所述目标用户为与所述待识别声纹向量相似度最大的声纹模型向量对应的用户时,获得所述目标用户的目标兴趣特征向量,其中,所述目标兴趣特征向量为:所述目标用户的兴趣标签向量化构建的向量;
对每一条搜索结果进行向量化处理,获得向量化的搜索结果;
分别计算获得每一向量化后的搜索结果与所述目标兴趣特征向量之间的相似度;
按照所获得相似度由高到低的顺序对所获得的搜索结果进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710538452.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于互感器的标签加固装置
- 下一篇:标贴剥离机