[发明专利]一种短语音说话人识别方法和装置有效
| 申请号: | 201711472767.4 | 申请日: | 2017-12-29 |
| 公开(公告)号: | CN108281146B | 公开(公告)日: | 2020-11-13 |
| 发明(设计)人: | 苏鹏程;张一凡 | 申请(专利权)人: | 歌尔科技有限公司 |
| 主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/08;G10L25/24 |
| 代理公司: | 北京市隆安律师事务所 11323 | 代理人: | 权鲜枝;吴昊 |
| 地址: | 266104 山东省青岛*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 说话 识别 方法 装置 | ||
本发明公开了一种短语音说话人识别方法和装置,方法包括:对输入的训练短语音信号预处理后,提取梅尔频率倒谱系数作为训练特征向量,利用自适应核可能性模糊C均值聚类算法进行聚类分析建立说话人语音参考模型;对输入的测试短语音信号预处理后,提取梅尔频率倒谱系数作为测试特征向量,计算测试特征向量与说话人语音参考模型之间的距离,并根据距离识别短语音说话人的身份。本实施例的短语音说话人识别方法和装置通过提取梅尔频率倒谱系数作为特征,利用特征以及自适应核可能性模糊C均值聚类算法进行聚类分析建立说话人语音参考模型,执行模式匹配后识别出短语音说话人的身份,提高了识别正确率,满足了实际应用需求。
技术领域
本发明涉及语音识别技术领域,特别涉及一种短语音说话人识别方法和装置。
背景技术
在现代社会,随着信息技术的发展,如何进行个人身份的识别进而保护私人数据,有着越来越广泛的需求。利用人的生物特征进行识别是一种既方便又可靠的选择,如指纹、虹膜、声音等。相对于指纹、虹膜识别来说,人声的采集成本低廉、操作简便,同时声音带有较强的个人特性,可以利用声音作为一种方便的识别说话人身份的手段。对于短语音说话人识别,由于语音时间很短,提取的特征有限,说话人识别性能不高,难以满足实际应用需求。
发明内容
本发明提供了一种短语音说话人识别方法和装置,以解决现有技术短语音说话人识别性能不高,难以满足实际需求的问题。
根据本申请的一个方面,提供了一种短语音说话人识别方法,该短语音说话人识别方法包括:
对输入的训练短语音信号预处理后,提取梅尔频率倒谱系数作为训练特征向量,利用自适应核可能性模糊C均值聚类算法进行聚类分析建立说话人语音参考模型;
对输入的测试短语音信号预处理后,提取梅尔频率倒谱系数作为测试特征向量,计算所述测试特征向量与所述说话人语音参考模型之间的距离,并根据所述距离识别短语音说话人的身份。
根据本申请的另一个方面,提供了一种短语音说话人识别装置,该短语音说话人识别装置包括:
模型训练单元,用于对输入的训练短语音信号预处理后,提取梅尔频率倒谱系数作为训练特征向量,利用自适应核可能性模糊C均值聚类算法进行聚类分析建立说话人语音参考模型;
说话人识别单元,用于对输入的测试短语音信号预处理后,提取梅尔频率倒谱系数作为测试特征向量,计算所述测试特征向量与所述说话人语音参考模型之间的距离,并根据所述距离识别短语音说话人的身份。
根据本申请的又一个方面,提供了一种电子设备,包括:存储器和处理器,所述存储器和所述处理器之间通过内部总线通讯连接,所述存储器存储有能够被所述处理器执行的程序指令,所述程序指令被所述处理器执行时能够实现本申请的一个方面的短语音说话人识别方法。
本发明的有益效果是:本发明实施例的短语音说话人识别方法和装置,对输入的训练短语音信号预处理后,提取梅尔频率倒谱系数作为训练特征向量,利用自适应核可能性模糊C均值聚类算法进行聚类分析建立说话人语音参考模型并保存;对输入的测试短语音信号预处理后,提取相同特征得到测试特征向量后计算测试特征向量与说话人语音参考模型之间的距离,并根据距离识别短语音说话人的身份。本实施例的短语音说话人识别方法和装置利用新的自适应核可能性模糊C均值聚类算法(AKPFCM)进行聚类建模,克服了在短语音情况下说话人识别性能下降的缺陷,提高了短语音识别正确率,满足了实际应用需求。
附图说明
图1为本发明一个实施例的短语音说话人识别方法的流程图;
图2为本发明一个实施例的短语音说话人识别原理图;
图3为本发明一个实施例的语音信号预处理的流程图;
图4为本发明一个实施例的MFCC特征提取的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于歌尔科技有限公司,未经歌尔科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711472767.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法和系统
- 下一篇:基于LPCC和ADTW的声纹识别系统





