[发明专利]一种基于识别模型提升声纹识别准确度的方法和系统在审
申请号: | 201610024188.2 | 申请日: | 2016-01-14 |
公开(公告)号: | CN106971732A | 公开(公告)日: | 2017-07-21 |
发明(设计)人: | 祝铭明 | 申请(专利权)人: | 芋头科技(杭州)有限公司 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/02 |
代理公司: | 上海申新律师事务所31272 | 代理人: | 党蕾 |
地址: | 310000 浙江省杭州市余杭区*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 识别 模型 提升 声纹 准确度 方法 系统 | ||
技术领域
本发明涉及声纹识别技术领域,具体而言,涉及一种基于识别模型提升声纹识别准确度的方法和系统。
背景技术
声纹识别技术,又称说话人识别技术(Speaker Recognition),被认为是最自然的生物认证技术,它是通过语音信号提取代表说话人身份的相关特征(如反映声门开合频率的基本特征、反映口腔大小形状及声道长度的频谱特征等),进而识别出说话人身份等工作方面的技术,正被越来越多的智能设备所运用,具体的声纹识别(Voiceprint Recognition,VPR),其包括两类,分别是:1)说话人辨认(Speaker Identification)和2)说话人确认(Speaker Verification)。前者用以判断某段语音是若干人中的哪一个所说的;而后者用以确认某段语音是否是指定的某个人所说的。在不同的应用环境中可能会使用到不同的声纹识别技术或者不同技术的结合。
然而现有的声纹识别技术并不是很完善,使用者所建立的识别模型,往往受到外其他因素影响,比如同一个人的声音易受身体状况、年龄、情绪等的影响,或者不同的麦克风和信道对声纹识别产生不同的影响,又或者环境噪音对声纹识别产生干扰,均会影响声纹识别的准确度。
发明内容
根据现有技术中存在的上述问题,现提供一种基于识别模型提升声纹识别准确度的方法及系统的技术方案,具体包括:
一种基于识别模型提升声纹识别准确度的方法,其中,包括:
获取同一使用者在不同状态下的声纹,以构建同一个使用者的多个与所述声纹相对应的背景识别模型,其中,所述背景声纹特征中包括多个背景声纹特征向量;
根据所述背景识别模型构建所述标准识别模型;
获取未识别声纹中的未识别声纹特征,其中,所述未识别声纹特征中至少包括所述未识别声纹的小波元素;
将所述未识别声纹特征与声纹识别模型中的标准声纹特征处理得到对应于所述未识别声纹的辨别度;
判断所述辨别度是否大于一预设的标准阈值,当所述辨别度大于所述标准阈值时,则识别出所述未识别声纹为锁定声纹;
当识别出所述未识别声纹为未识别声纹时,对所述标准识别模型生成一识别记录;
统计所述标准识别模型对应的识别记录,形成统计结果;
根据所所述统计结果,对所述标准识别模型进行降序排序;
所述小波元素包括实小波元素和/或复小波元素,其中,所述获取未识别声纹中的未识别声纹特征包括:
检测所述未识别声纹中的浊音区间;
在每个所述浊音区间中检测基音区间,并在每个所述基音区间中获取所述声纹特征的所述实小波元素和/或所述复小波元素。
优选的,该基于识别模型提升声纹识别准确度的方法,其中,在所述提取未识别声纹中的未识别声纹特征之前,还包括:
采集所述未识别声纹;
至少根据所述未识别声纹特征中的未识别声纹特征向量调整预先构建的标准识别模型中与所述未识别声纹特征向量对应的声纹特征向量参数,以构造出与所述未识别声纹相适应的所述声纹识别模型中的所述标准声纹特征中的标准声纹特征向量。
优选的,该基于识别模型提升声纹识别准确度的方法,其中,所述未识别声纹特征中包括多个所述未识别声纹特征向量,所述标准声纹特征中包括多个所述标准声纹特征向量,其中,所述至少根据所述未识别声纹特征与声纹识别模型中的标准声纹特征处理得到所述未识别声纹的辨别度包括:
处理得到所述未识别声纹特征中的每个所述未识别声纹特征向量与所述标准声纹特征中每个与所述未识别声纹特征向量相对应的所述标准声纹特征向量的向量距离;
根据处理得到的多个所述向量距离处理得到所述未识别声纹特征与所述标准声纹特征的目标距离;
至少利用所述未识别声纹特征与所述标准声纹特征的所述目标距离处理得到所述未识别声纹的辨别度。
优选的,该基于识别模型提升声纹识别准确度的方法,其中,所述至少利用所述未识别声纹特征与所述标准声纹特征的距离处理得到所述未识别声纹的辨别度包括:
处理得到所述未识别声纹特征分别与多个所述背景识别模型对应的每个所述声纹的所述背景声纹特征的背景距离;
根据多个所述背景距离处理得到距离平均值及距离标准差;
处理得到所述未识别声纹特征与所述标准声纹特征的所述目标距离与所述距离平均值的差值;
处理得到所述差值与所述距离标准差的比值,将所述比值作为所述未识别声纹的所述辨别度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于芋头科技(杭州)有限公司,未经芋头科技(杭州)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610024188.2/2.html,转载请声明来源钻瓜专利网。