[发明专利]一种基于线谱频率差值的文本无关的说话人鉴别装置无效
申请号: | 201410134694.8 | 申请日: | 2014-04-03 |
公开(公告)号: | CN103871411A | 公开(公告)日: | 2014-06-18 |
发明(设计)人: | 马占宇;齐峰;张洪刚 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 线谱 频率 差值 文本 无关 说话 鉴别 装置 | ||
技术领域
本发明着重描述了一种基于线性变换的线谱频率参数和超狄利克雷混合模型的文本无关的说话人识别系统。
背景技术
随着计算机技术的发展,利用人的生物特征(如指纹,声纹,人脸)进行身份识别或确认具有非常重要的研究及应用价值。说话人识别是根据语音波形中反映说话人生理和行为的特征的语音参数,自动确认说话人是否在所记录的话者集合中,进一步确认说话人的身份。说话人识别又包括说话人鉴别和说话人确认两部分。说话人鉴别系统通常包括三部分:提取能代表说话人的特征,对每个说话人训练一个符合其所选特征的统计规律的独立的模型,最后通过比较输入数据与已经获得的模型来做出决策。
对于第一部分提取特征,基于声道特征分析语音信号是目前说话人识别中效果较好的方法,常用的特征主要有:美尔倒谱系数(MFCC:Mel-frequency Cepstral Coefficients)和线性频谱系数(LSF:Line Spectral Frequencies)。传统的美尔倒谱系数(MFCC)向量用差分的方法表达动态信息,本发明采用线谱频率差值表示的特征超向量保存了原有的邻域信息。另外,本发明所述的方法还考虑了美尔倒谱系数(MFCC)所忽略的对机器鉴别说话人有用的高频信息。
识别方法上目前可分为三类:模板匹配法,概率模型法,和人工神经网络方法。概率模型采用某种概率密度函数来描述说话人的语音特征空间的分布情况,并以该概率密度函数的一组参数作为说话人模型。高斯混合模型(GMM:Gaussian Mixture Model)由于简单高效已广泛地应用于文本无关的说话人识别系统。但是,本发明所采用的超狄利克雷混合模型(SDMM:super-Dirichlet Mixture Model)能够更好的描述所抽取特征的有界性和有序性。
根据识别对象的不同,可以将说话人识别分为文本有关和文本无关两类。其中文本有关的说话人识别技术,要求说话人的发音的关键词和关键句子作为训练文本,识别时按照相同的内容发音。文本无关的说话人识别技术,不论是在训练时还是在识别时都不规定说话内容,识别对象是自由的语音信号,需要在自由的语音信号中找到能表征说话人的信息的特征和方法,因此建立说话人模型相对困难。此外,文本有关的识别系统容易被窃录冒认,使用不方便,本发明所描述的是文本无关的识别系统。
发明内容
为了解决上述技术所存在的缺陷并提高文本无关的说话人鉴别率,本发明提供一种基于线性变换的线谱频率参数和超狄利克雷混合模型的文本无关的说话人识别装置。
为达到上述目的,本发明提出的文本无关的说话人识别方法包括下列步骤:
一、特征提取步骤
A、线谱频率参数变换步骤:在语音线性编码预测模型中,用线谱频率参数通过线性变换转化为线谱频率参数差值;
B、生成线谱频率特征超向量步骤:结合当前帧和其前后相邻的两帧形成一个特征超向量来表达动态信息。
二.模型训练步骤:对每个说话人都用长度为T的帧序列训练模型,使用超狄利克雷混合模型(SDMM:super-Dirichlet Mixture Model)模拟特征超向量的分布,通过梯度法解方程求出模型中的参数α,最终得到一系列模型,每个模型对应一个说话人。
三.鉴别匹配步骤:取训练集中某说话人的语音样本输入已经训练好的一系列概率模型中,采用步骤一中的方法变换参数和生成特征超向量,通过步骤二中训练出的模型计算针对每个概率模型的似然值,取其中最大的似然值来确认说话人的编号。
根据本发明的一个实施方式的一种与文本无关的说话人鉴别方法,步骤A所述的线谱频率参数变换步骤中,利用线谱频率参数的①非负特性,②有序特性和③有界特性将其变换为线性谱参数差值ΔLSF,此差值的特征为:①分布在(0,1)开区间内,②加和为1。此步骤具体过程如下:
1)K维线谱频率参数表示为s=[s1,s2,...,sK]T,满足0<s1<s2<,…,sK<π;
2)变换后的K+1维线谱频率参数差值ΔLSF为其中
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410134694.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有减震特征的流体轴承滑块
- 下一篇:氨纶印花双抗双面料及其生产方法