[发明专利]小数据库条件下正常语音流中耳语音的识别方法有效
| 申请号: | 201610723182.4 | 申请日: | 2016-08-25 |
| 公开(公告)号: | CN106328123B | 公开(公告)日: | 2020-03-20 |
| 发明(设计)人: | 陈雪勤;刘正;赵鹤鸣 | 申请(专利权)人: | 苏州大学 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/08;G10L15/16;G10L15/20 |
| 代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 陶海锋 |
| 地址: | 215123 江苏省*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据库 条件下 正常 语音 中耳 识别 方法 | ||
本发明公开了一种小数据库条件下正常语音流中耳语音的识别方法,构建语音识别分类系统,包括:数字语音输入模块;特征提取模块;深度神经网络,由深度信念网络和Softmax输出层构成;所述深度信念网络由受限玻尔兹曼机自下而上堆栈构成,频谱特征为深度信念网络的输入特征,Softmax输出层对应输出深度神经网络的目标值;获取训练数据集样本并进行至少一种处理:①采用重复方式对数据集进行人工扩展,扩展次数为8~24次;②对数据集进行置乱处理;对语音识别分类系统进行训练;采用训练后的分类系统对待识别的语音流进行识别。本发明在小数据库中能改善系统的识别性能,在实现耳语音识别的同时,保证了正常语音的识别率。
技术领域
本发明涉及一种语音信号处理技术,具体涉及一种在低资源小数据库条件下,对于出现在汉语正常语音流中的耳语音进行识别的方法。
背景技术
耳语音是一种特殊的交流方式,其发音时音量低且声带完全不振动。相比正常语音而言,它的感知和可懂度显著降低。尽管如此,耳语音也是人们日常交际的一种自然语音形式。它常常被用于在安静或保密环境下的交流,如讲话者不想打扰其他人,或者有一些私人信息需要交流。随着通信技术的发展,耳语音的人机交互接口也越来越受到关注,如在公司会议或公共场所使用智能手机等手持设备、金融业的数字密码系统等,如果能具有耳语音的识别功能,将大大提高接口的兼容性。
耳语音的发音与正常语音差异较大,几乎所有的声学特征包括激励、声道、振幅、频率等方面都明显不同。如耳语音的能量分布非常低,共振峰的中心频率上升,共振峰带宽变大,由于用耳语音讲话时完全没有声带振动,因此耳语音不含有基音信息。目前的语音处理系统的一般设计为面向正常语音的,因此,提高当前语音处理设备接口的兼容性是一个非常有意义的工作。
在实际应用中,耳语语音往往混合在中性语音流中出现。例如,在语言交流时对一些重要的信息,如帐户号码或密码,为避免被偷听,往往会用耳语交流。为适应这些场合的应用,需要对正常语音流中的耳语音进行孤立词识别,这就使得可用于学习的样本数据少,识别系统的学习难度大,识别率难以提高。因此如何在小数据库条件下实现正常语音流中的耳语音的识别,是本发明需要解决的问题。
发明内容
本发明的发明目的是提供一种小数据库条件下正常语音流中耳语音的识别方法,解决在对正常语音流中的耳语音孤立词进行识别时,由于样本数据量小导致的识别率难以提高的问题。
为达到上述发明目的,本发明采用的技术方案是:一种小数据库条件下正常语音流中耳语音的识别方法,包括如下步骤:
(1) 构建语音识别分类系统,所述语音识别分类系统包括:数字语音输入模块,用于对含有耳语音的语音流信号进行采样或者读取;特征提取模块,用于提取频谱特征;深度神经网络,由深度信念网络和Softmax输出层构成;
所述深度信念网络由多个受限玻尔兹曼机自下而上堆栈构成,所述频谱特征为深度信念网络的输入特征,所述Softmax输出层对应输出深度神经网络的目标值;
(2) 获取训练数据集样本,对训练数据集样本进行处理,所述处理包括以下方法中的至少一种:
①采用重复方式对数据集进行人工扩展,扩展次数为8~24次;
②对数据集进行置乱处理;
由此获得处理后的训练数据集;
(3) 采用步骤(2)获得的训练数据集对步骤(1)构建的语音识别分类系统进行训练,获得训练后的分类系统;
(4) 采用训练后的分类系统对待识别的语音流进行识别。
上述技术方案中,步骤(1)中,提取的频谱特征包括MFCC特征。
优选地,提取的频谱特征为12阶MFCC、对数能量、0阶倒谱系数、一阶导数、二阶导数,帧长25毫秒,帧移10毫秒。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610723182.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高浓度有机物污染土壤的修复方法
- 下一篇:调节变换系统温度的变换反应工艺





