[发明专利]一种基于线谱频率差值的文本无关的说话人鉴别装置无效

申请号：	201410134694.8	申请日：	2014-04-03
公开（公告）号：	CN103871411A	公开（公告）日：	2014-06-18
发明（设计）人：	马占宇;齐峰;张洪刚	申请（专利权）人：	北京邮电大学
主分类号：	G10L17/02	分类号：	G10L17/02;G10L17/04
代理公司：	暂无信息	代理人：	暂无信息
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明实施例公开了一种基于线谱频率差值的文本无关的说话人鉴别方法。该方法包括如下步骤：特征提取步骤：将线谱频率参数通过线性变换转化为线谱频率参数差值，结合当前帧和其前后相邻两帧形成一个生成线谱频率特征超向量；模型训练步骤：使用超狄利克雷混合模型模拟特征超向量的分布,并解出模型中的参数；鉴别步骤：对待鉴别人的语音序列按照步骤一提取特征，再输入步骤二所得到的模型，计算针对每个概率模型的似然值，获取最大似然值，确认说话人编号。利用本发明实施例，能够提高文本无关的说话人鉴别率，具有很大的实用价值。
搜索关键词：	一种基于线谱频率差值文本无关说话鉴别装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于线性变换的线谱频率参数和超狄利克雷混合模型的文本无关的说话人识别方法，其特征在于，包括以下步骤：一.特征提取步骤：A、线谱频率参数变换步骤：在语音线性编码预测模型中，用线谱频率参数通过线性变换转化为线谱频率参数差值；B、生成线谱频率特征超向量步骤：结合当前帧和其前后相邻的两帧形成一个特征超向量来表达动态信息。二.模型训练步骤：对每个说话人都用长度为T的帧序列训练模型，使用超狄利克雷混合模型（SDMM:super‑Dirichlet Mixture Model）模拟特征超向量的分布,通过梯度法解方程求出模型中的参数α,最终得到一系列模型，每个模型对应一个说话人。三.鉴别匹配步骤：取训练集中某说话人的语音样本输入已经训练好的一系列概率模型中，采用步骤一中的方法变换参数和生成特征超向量，通过步骤二中训练出的模型计算针对每个概率模型的似然值，取其中最大的似然值来确认说话人的编号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京邮电大学，未经北京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410134694.8/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于线谱频率差值的文本无关的说话人鉴别装置无效

专利文献下载