[发明专利]一种多特征融合的说话人识别方法在审
申请号: | 202110853614.4 | 申请日: | 2021-07-28 |
公开(公告)号: | CN113793613A | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 于玲;孙佳宁 | 申请(专利权)人: | 辽宁工业大学 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/20;G10L25/03;G10L25/12;G10L25/24 |
代理公司: | 沈阳利泰专利商标代理有限公司 21209 | 代理人: | 李枢 |
地址: | 121001 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 融合 说话 识别 方法 | ||
一种多特征融合的说话人识别方法,属于说话人识别技术领域,本方法的特征是在特征提取部分通过将短时能量、线性预测倒谱系数LPCC、梅尔倒谱系数MFCC及其一阶动态特征差分系数进行有机结合来提高说话人识别算法的识别率。首先,取8维线性预测倒谱系数LPCC;然后,取12维梅尔倒谱系数MFCC,并将梅尔倒谱系数MFCC中第一维特征分量替换成短时能量;最后,对12维梅尔倒谱系数MFCC进行一阶差分,得到一组新的梅尔倒谱差分系数,作为特征矢量的一组分量。实验证明本发明与采用传统特征提取方法的GMM说话人识别相比能显著提高说话人识别正确率。
技术领域
本发明涉及智能音箱中说话人识别技术领域,涉及到特征提取部分的多特征融合方法,特别涉及到将短时能量、线性预测倒谱系数LPCC、梅尔倒谱系数MFCC及其一阶动态特征差分系数进行有机结合的方法。
背景技术
随着人们对于居家生活质量要求的逐渐提高,智能音箱走进人们的生活。但在实际生活中智能音箱容易出现被环境噪音干扰而无法准确被唤醒的情况。为了解决该问题,研究工作者提出在进行说话人识别前进行特征提取,但采用任一单独的特征分量提取来进行说话人识别都可能出现对语音的清音识别不准确,或者抗噪性很差的情况。
因此,本发明采取多特征融合算法,将线性预测倒谱系数LPCC、梅尔倒谱系数MFCC及其一阶动态特征差分系数进行有机结合,并将梅尔倒谱系数MFCC中第一维特征分量替换成短时能量,为解决设备容易被环境音错误激活的问题提出了切实可行的办法。
发明内容
本发明的主要目的是提供一种多特征融合的说话人识别方法,在特征提取部分进行多特征融合的说话人识别方法。
多特征融合的说话人识别方法,包括以下步骤:
A.计算线性预测倒谱系数LPCC。
A1.计算出预测系数。
A2.将预测系数带入线性预测倒谱公式,计算出8维线性预测倒谱系数LPCC。
B.计算梅尔倒谱系数MFCC的特征系数。
B1.计算12维梅尔倒谱系数MFCC。
B2.将第一维梅尔倒谱系数MFCC的特征分量去掉。
C.计算短时能量特征系数。
C1.对语音信号进行取平方处理。
C2.对其进行归一化处理和取对数处理。
D.计算一阶动态差分特征系数。
D1.将一维短时能量与梅尔倒谱系数MFCC进行有机结合。
D2.将有机结合后的12维特征分量进行一阶差分,得到一组新的差分系数。
E.将多特征进行有机结合。
其优点在于:
本发明首先利用公式计算线性预测倒谱系数LPCC的特征系数,然后利用公式计算梅尔倒谱系数MFCC,并将1维短时能量与梅尔倒谱系数MFCC进行有机结合,之后取有机结合后的12维梅尔倒谱系数MFCC特征分量的一阶动态差分系数。最后将多特征进行有机结合来提高对说话人识别的准确率。本方法不但提出了将线性预测倒谱系数LPCC、梅尔倒谱系数MFCC及其一阶动态特征差分系数进行有机结合的特征提取方法,还解决了设备容易被环境音错误激活的问题,降低了智能音箱的误唤醒率。
附图说明
附图1是本发明中的多特征融合方法的总体流程图。
附图2是本发明中梅尔倒谱系数MFCC系数的计算过程。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工业大学,未经辽宁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110853614.4/2.html,转载请声明来源钻瓜专利网。