[发明专利]识别声纹的方法及设备有效
申请号: | 201710434570.5 | 申请日: | 2017-06-09 |
公开(公告)号: | CN107610708B | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 王健宗;罗剑;郭卉;肖京 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/02;G10L17/06 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 官建红 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声纹 声纹特征 语音数据 通用 向量 声纹识别 通信媒介 构建 预设 互联网技术 模型确定 使用场景 语音特征 灵活 | ||
本发明适用于互联网技术领域,提供了一种识别声纹的方法及设备,该方法包括:建立并训练通用识别模型,所述通用识别模型用于表示预设通信媒介下语音特征的分布;获取所述预设通信媒介下的语音数据;根据所述语音数据构建对应的所述声纹向量;根据所述通用识别模型确定所述声纹向量对应的所述声纹特征。本发明通过构建和训练通用识别模型对语音数据进行处理,得到对应的声纹向量,从而确定声纹特征,并根据声纹特征识别发出声音的人,由于通用识别模型不限制声音的内容,因此使本声纹识别的使用比较灵活,增多了声纹识别的使用场景。
技术领域
本发明属于互联网技术领域,尤其涉及识别声纹的方法及设备。
背景技术
现有技术中,在声纹识别过程中进行声纹特征提取时,准确率不高,为了尽可能达到声纹识别的准确,往往会要求用户读指定的内容,例如读“一、二、三”等,并对指定的内容进行声纹识别,这种方法可以在一定程度上提高声纹识别的准确性,但是,这种方式具有较大的局限性,由于用户必须朗读指定内容才能完成识别,因此限制了声纹识别的使用场景,例如在需要取证时,无法要求对方朗读指定的内容。
针对现有技术中只能对指定内容进行声纹识别的问题,目前业界没有理想的解决办法。
发明内容
有鉴于此,本发明实施例提供了识别声纹的方法及设备,以解决现有技术中只能对指定内容进行声纹识别的问题。
本发明实施例的第一方面提供了一种识别声纹的方法,包括:
建立并训练通用识别模型,所述通用识别模型用于表示预设通信媒介下语音特征的分布;
获取所述预设通信媒介下的语音数据;
根据所述语音数据构建对应的所述声纹向量;
根据所述通用识别模型确定所述声纹向量对应的所述声纹特征。
本发明实施例的第二方面提供了一种识别声纹的设备,该设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的识别声纹的程序,所述处理器执行所述识别声纹的程序时,实现如下步骤:
建立并训练通用识别模型,所述通用识别模型用于表示预设通信媒介下语音特征的分布;
获取所述预设通信媒介下的语音数据;
根据所述语音数据构建对应的所述声纹向量;
根据所述通用识别模型确定所述声纹向量对应的所述声纹特征。
本发明实施例的第三方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有识别声纹的程序,所述识别声纹的程序被至少一个处理器执行时,实现如下步骤:
建立并训练通用识别模型,所述通用识别模型用于表示预设通信媒介下语音特征的分布;
获取所述预设通信媒介下的语音数据;
根据所述语音数据构建对应的所述声纹向量;
根据所述通用识别模型确定所述声纹向量对应的所述声纹特征。
本发明通过构建和训练通用识别模型对语音数据进行处理,得到对应的声纹向量,从而确定声纹特征,并根据声纹特征识别发出声音的人,由于通用识别模型不限制声音的内容,因此使本声纹识别的使用比较灵活,增多了声纹识别的使用场景。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的识别声纹的方法的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710434570.5/2.html,转载请声明来源钻瓜专利网。