[发明专利]一种语音信号的喉声和气声识别与分离方法及系统有效
| 申请号: | 201710692892.X | 申请日: | 2017-08-14 |
| 公开(公告)号: | CN107657962B | 公开(公告)日: | 2020-06-12 |
| 发明(设计)人: | 何庆祥;张巍;霍颖翔;冯镇业;滕少华;张子臻 | 申请(专利权)人: | 广东工业大学 |
| 主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/51 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 胡辉 |
| 地址: | 510006 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 信号 和气 识别 分离 方法 系统 | ||
本发明公开了一种语音信号的喉声和气声识别与分离方法及系统,方法包括:获取单峰测试掩模函数和还原掩模函数;对输入的语音信号进行叠窗快速傅里叶变换,得到傅里叶变换后的幅值谱;测定各窗信号经傅里叶变换后的幅值谱的基频;根据单峰测试掩模函数和测定的基频计算傅里叶变换后的幅值谱在正整数倍基频处的幅值峰值;根据计算的幅值峰值得到喉声分量的包络;根据还原掩模函数和计算的幅值峰值计算喉声分量的幅值谱;根据傅里叶变换后的幅值谱和喉声分量的幅值谱计算气声分量的幅值谱;根据气声分量的幅值谱得到气声分量的包络。本发明引入了单峰测试掩模函数和还原掩模函数,能识别并分离语音信号中的喉声和气声,可广泛应用于信号处理领域。
技术领域
本发明涉及信号处理领域,尤其是一种语音信号的喉声和气声识别与分离方法及系统。
背景技术
语音是语言的声学表现,是人类交流信息最自然、最有效、最方便的手段,也是人类进行思维的一种依托。人类开始进入了信息化时代,用现代手段研究语音处理技术,使人们能更加有效地产生、传输、存储和获取语音信息,这对于促进社会的发展具有十分重要的意义。最近几十年,对语音的研究使科学家和工程师们走到一起,从而形成了一门重要的学科:语音信号处理。语音信号处理技术简称语音处理,它与语言学、语音学、心理学、声学、计算机学以及人工智能等学科都有着紧密的联系,极大地推动了社会的科技进步,我们可以用自动语音识别技术,使手写文稿和手工打印文本变成自动听写机操作;把人工查阅各种书面文字资料的操作变为口呼自动查阅各种各样的数据库;可以采用语音合成技术,将存储的语音或文字资料转化为语音高质量的回放,甚至自动翻译成另一种语言的语音回放或进行文字显示。总而言之,语音信号处理技术的研究对于信息化社会的发展具有极其重要的意义。
由于语音中喉咙部分发出的震动声音(简称喉声)和唇齿部分发出的气声(简称气声)有明显不同的特性,所以在进行音频压缩等后续操作时,需要分别对喉声和气声进行单独的处理。但目前尚未能将喉声和气声从语音信号中分离出来,如何识别并分离语音信号中的喉声和气声就成了业内亟需解决的技术难题。
发明内容
为解决上述技术问题,本发明的目的在于:提供一种语音信号的喉声和气声识别与分离方法。
本发明的另一目的在于:提供一种语音信号的喉声和气声识别与分离系统。
本发明所采取的技术方案是:
一种语音信号的喉声和气声识别与分离方法,包括以下步骤:
获取单峰测试掩模函数和还原掩模函数;
对输入的语音信号进行叠窗快速傅里叶变换,得到傅里叶变换后的幅值谱;
测定各窗信号经傅里叶变换后的幅值谱的基频;
根据单峰测试掩模函数和测定的基频计算傅里叶变换后的幅值谱在正整数倍基频处的幅值峰值;
根据计算的幅值峰值得到喉声分量的包络;
根据还原掩模函数和计算的幅值峰值计算喉声分量的幅值谱;
根据傅里叶变换后的幅值谱和喉声分量的幅值谱计算气声分量的幅值谱;
根据气声分量的幅值谱得到气声分量的包络。
进一步,所述获取单峰测试掩模函数和还原掩模函数这一步骤,具体包括:
计算出使用标准差为σ的正态分布窗函数时对应的频域响应特性掩模参数η,进而确定掩模模板函数L(x,ω,σ),其中,x为频域上幅值谱的频率位置,ω为角速度,A为幅值;
根据掩模模板函数L(x,ω,σ)得到单峰测试掩模函数和还原掩模函数,所述单峰测试掩模函数Vk(j,fi,σ)和还原掩模函数Uk(j,fi,σ)的表达式分别为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710692892.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于VAD和ANN的噪声消除方法
- 下一篇:哭声辨识系统与哭声辨识方法





