[发明专利]一种基于分组统计的HMM声纹识别签到方法及系统有效
| 申请号: | 201510109362.9 | 申请日: | 2015-03-12 |
| 公开(公告)号: | CN104732972B | 公开(公告)日: | 2018-02-27 |
| 发明(设计)人: | 张晶;姚敏锋;王金矿 | 申请(专利权)人: | 广东外语外贸大学 |
| 主分类号: | G10L15/14 | 分类号: | G10L15/14;G10L15/30 |
| 代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 禹小明 |
| 地址: | 510006 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 分组 统计 hmm 声纹 识别 签到 方法 系统 | ||
技术领域
本发明涉及声纹识别技术领域,更具体地,涉及一种基于分组统计的HMM声纹识别签到方法及系统。
背景技术
在嵌入式操作系统中实现声纹识别签到,通常需要对输入的声纹进行预处理,将数据传输到服务器,进而生成声纹模型,模式匹配,最后输出并记录结果。其中,声纹模型引用了隐马尔可夫模型(HMM)的两个参数(B,π),该模型的训练采用了Baum_Welch算法。一般可以用λ=(A,B,π)三元组来简洁的表示一个隐马尔可夫模型。隐马尔可夫模型实际上是标准马尔可夫模型的扩展,添加了可观测状态集合和这些状态与隐含状态之间的概率关系。模式匹配通常采取Viterbi算法进行模式匹配。张卫清的《语音识别算法的研究》提供了详细的Viterbi算法及隐马尔科夫模型的描述。传统模式匹配算法,需要对所有模板进行匹配,当模板数量增加时,匹配过程所消耗的时间而随之增加,也即当要识别的声纹数量较大时,识别效率和实时性较差,进而导致签到效率低下。
发明内容
本发明旨在至少在一定程度上解决上述技术问题。
本发明的首要目的是克服上述现有技术所述的识别效率和实时性较差缺陷,提供一种识别效率和实时性高的基于分组统计的HMM声纹识别签到方法。
本发明的进一步目的是提供一种识别效率和实时性高的基于分组统计的HMM声纹识别签到系统。
为解决上述技术问题,本发明的技术方案如下:
一种基于分组统计的HMM声纹识别签到方法,通过签到客户端采集声纹信号,并通过网络传输至签到服务器进行签到,所述方法包括以下步骤:
S1:采集签到者的声纹信号;
S2:对声纹信号进行预处理,其预处理过程依次包括预加重、分帧、加窗和端点检测,将预处理后的声纹信号通过网络传输至服务器;
S3:对声纹信号进行声纹特征参数提取;
S4:生成分组特征参数,包括生成签到者分组特征参数以及生成分组模型的分组特征参数;
S5:根据分组模型的每个分组的分组特征参数与签到者声纹的分组特征参数,判断签到者是否为某个分组的成员;
S6:对签到者的声纹进行判定。
在一种优选的方案中,步骤S2中,对声纹信号进行预处理具体包括以下步骤:
S2.1:预加重,在预加重过程中,
传递函数为:H(z)=1-0.9375z-1,
得到的信号为:
S2.2:分帧,以10~20ms为间隔将声纹信号分为若干帧,一帧为一个基本单位;
S2.3:加窗,采用了汉明窗函数来进行窗化,即:0≤n≤N-1,其中:0≤n≤N-1;
S2.4:端点检测,通过信号的短时过零率和短时能量两个系数来检测声纹信号的端点的,两个系数的公式如下:
短时能量:
短时过零率:
在一种优选的方案中,步骤S3中,对声纹信号进行声纹特征参数提取,具体包括以下步骤:
S3.1:对声纹信号进行快速傅里叶变换获取能量频谱;
S3.2:将能量频谱能量乘以一组N个三角带通滤波器,求得每一个滤波器输出的对数能量(Log Energy)Ek,所述的N个三角带通滤波器在梅尔频率(Mel Frequency)上是平均分布的,梅尔频率mel(f)和一般频率f的关系式为:
mel(f)=2595*log10(1+f/700);
S3.3:将得到的N个对数能量Ek带入离散余弦转换(DCT),求出L阶的Mel-scale Cepstrum参数,得到L个倒频谱参数,离散余弦转换公式如下:
Cm=Ncos[m*(k-0.5)*p/N]*Ek,m=1,2,...,L;
S3.4:提取声纹信号一个帧的对数能量,一个帧的对数能量定义为一个帧内讯号的平方和,再取以10为底的对数值,再乘以10;
S3.5:提取声纹信号的差量倒频谱参数,差量倒频谱参数表示倒频谱参数相对于时间的斜率,公式如下:
这里M的值取2或3,t代表音框的数目,Cm(t)指第t框的倒频谱参数。
在一种优选的方案中,步骤S4中,生成分组特征参数的方法具体包括以下步骤:
S4.1:分组集合的生成,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东外语外贸大学,未经广东外语外贸大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510109362.9/2.html,转载请声明来源钻瓜专利网。





