[发明专利]语音检索方法、装置、设备及存储介质有效
申请号: | 202110133004.7 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112445934B | 公开(公告)日: | 2021-04-20 |
发明(设计)人: | 丁浩杰;邓箐;吴富章 | 申请(专利权)人: | 北京远鉴信息技术有限公司 |
主分类号: | G06F16/683 | 分类号: | G06F16/683;G06F16/65;G06F16/61;G06F40/284 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 荣颖佳 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 检索 方法 装置 设备 存储 介质 | ||
本申请提供一种语音检索方法、装置、设备及存储介质,属于语音关键词检测技术领域。语音检索方法包括:获取检索音频;采用预先训练得到的分类模型,得到检索音频的至少一个第一向量序列,各第一向量序列分别对应一种音频速度;根据各第一向量序列中目标向量的预设维上的值,生成各第一向量序列对应的索引值;获取被检索音频库中已存音频的索引值映射表;根据各第一向量序列对应的索引值以及索引值映射表,从被检索音频库中检索得到检索结果;输出检索结果。本申请可以提高检索的效率。
技术领域
本申请涉及语音关键词检测技术领域,具体而言,涉及一种语音检索方法、装置、设备及存储介质。
背景技术
随着互联网的发展,音频数据越来越多,在海量音频数据中检索到所需的信息已成为迫切的需求。
目前基于样例的关键词检索,在连续语音上检索时,由于关键词出现的位置是未知的,于是需要在被检索音频向量序列上通过滑动匹配的方式去检索关键词。
然而目前采用的检索方式,无论是在检索匹配过程中采用向量间浮点运算还是滑动机制都相对低效,例如:音频的表示向量都是高维向量序列,这导致在浮点数计算上非常耗时。并且滑动匹配这种方式,由于滑动时为了避免遗漏,步长都比较小,所以传统的滑动匹配方式会导致做很多无用匹配,增加了资源消耗,这些原因导致目前的检索方式比较低效。
发明内容
本申请的目的在于提供一种语音检索方法、装置、设备及存储介质,可以提高检索的效率。
本申请的实施例是这样实现的:
本申请实施例的一方面,提供一种语音检索方法,包括:
获取检索音频,检索音频包括至少一个关键词;
采用预先训练得到的分类模型,得到检索音频的至少一个第一向量序列,各第一向量序列分别对应一种音频速度;根据各第一向量序列中目标向量的预设维上的值,生成各第一向量序列对应的索引值,目标向量为第一向量序列中的第一个向量;
获取被检索音频库中已存音频的索引值映射表,索引值映射表的每行用于记录一个索引值与已存音频的第二向量序列中一个或多个向量的映射关系,在预设维上的值相等的向量映射至同一个索引值;
根据各第一向量序列对应的索引值以及索引值映射表,从被检索音频库中检索得到检索结果;
输出检索结果。
可选地,根据各第一向量序列对应的索引值以及索引值映射表,从被检索音频库中检索得到检索结果,包括:
从索引值映射表中筛选出索引值为各第一向量序列对应的索引值的目标行,将目标行中的向量组成待匹配向量集合;
针对待匹配向量集合中的每个向量,分别对以该向量为起始向量的第二向量序列中的子向量序列与各第一向量序列进行匹配处理,得到与检索音频匹配的至少一个子向量序列;
根据至少一个子向量序列,得到检索结果。
可选地,针对待匹配向量集合中的每个向量,分别对以该向量为起始向量的第二向量序列中的子向量序列与各第一向量序列进行匹配处理,得到与检索音频匹配的至少一个子向量序列,包括:
顺序计算子向量序列中每个第一向量与一个第一向量序列中对应的第二向量的异或值,第一向量在子向量序列中的位置与第二向量在第一向量序列中的位置相同;
对所计算得到的异或值进行累加,得到相似度结果;
若相似度结果满足预设阈值,则确定子向量序列与检索音频匹配。
可选地,根据至少一个子向量序列,得到检索结果,包括:
对至少一个子向量序列进行去重复处理,得到处理后的子向量序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京远鉴信息技术有限公司,未经北京远鉴信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110133004.7/2.html,转载请声明来源钻瓜专利网。