[发明专利]语音信号的处理方法、装置以及电子设备在审
| 申请号: | 202110055549.0 | 申请日: | 2021-01-15 |
| 公开(公告)号: | CN112863488A | 公开(公告)日: | 2021-05-28 |
| 发明(设计)人: | 许伟亮;邓建龙 | 申请(专利权)人: | 广东优碧胜科技有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/22 |
| 代理公司: | 北京汇思诚业知识产权代理有限公司 11444 | 代理人: | 朱娟 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 信号 处理 方法 装置 以及 电子设备 | ||
本申请实施例提供一种语音信号的处理方法、装置以及电子设备,所述方法包括:获取输入的语音信号;对所述输入的语音信号进行特征提取,获得第一数量的第一特征和第二数量的第二特征;基于所述第一数量的第一特征,获得第一数量的第一线性判别比;基于所述第二数量的第二特征,获得第二数量的第二线性判别比;对所述第一数量的第一线性判别比进行筛选,得到第三数量的第一线性判别比,确定第三数量的第一特征;对所述第二数量的第二线性判别比进行筛选,得到第四数量的第二线性判别比,确定第四数量的第二特征;根据所述第三数量的第一特征和所述第四数量的第二特征,获得语音特征。
技术领域
本申请涉及语音识别技术领域,特别涉及一种语音信号的处理方法、装置以及电子设备。
背景技术
在智能化潮流的背景下,智能语音设备如语音机器人、人机交互设备等,广泛地应用于家居、餐厅、工作、车辆等领域。通常情况下,在人机交互时,用户需要发出唤醒语音(如唤醒词等),以唤醒智能语音设备。因此,唤醒语音的识别是作为人机交互的重要环节之一。特别在餐厅等环境中,环境噪声比较复杂,如何准确地识别出唤醒语音是提高人机交互体验的问题之一。
目前市场上,现有技术中唤醒语音识别中提取的特征数据较多,特别对于餐厅中环境噪声较为复杂的情况下,需借助强大的云端平台进行数据分析,大大地增加了成本,不利于实际产品落地。
另外,现有技术的语音识别方法中利用MFCC语音特征进行语音识别,该方法仅适合在高频区间内识别语音特征,无法全面地识别语音特征,易导致部分低频语音无法识别的现象,人机交互体验较差。
发明内容
本申请提供了一种语音信号的处理方法、装置以及电子设备,能够更全面地获取语音特征,并去除不稳定特征,有利于提高语音识别率,提高人机交互体验。
第一方面,本申请提供了一种语音信号的处理方法,包括:
获取输入的语音信号;
对所述输入的语音信号进行特征提取,获得第一数量的第一特征和第二数量的第二特征;
基于所述第一数量的第一特征,获得第一数量的第一线性判别比;
基于所述第二数量的第二特征,获得第二数量的第二线性判别比;
对所述第一数量的第一线性判别比进行筛选,得到第三数量的第一线性判别比,所述第三数量小于所述第一数量;
对所述第二数量的第二线性判别比进行筛选,得到第四数量的第二线性判别比,所述第四数量小于所述第二数量;
基于所述第三数量的第一线性判别比,确定第三数量的第一特征;
基于所述第四数量的第二线性判别比,确定第四数量的第二特征;
根据所述第三数量的第一特征和所述第四数量的第二特征组成,获得到语音特征。
其中一种可能的实现方式中,所述对所述第一数量的第一线性判别比进行筛选,得到第三数量的第一线性判别比,所述第三数量小于所述第一数量,包括:
确定所述第一数量的第一线性判别比中第一线性判别比最大值和最小值;
选取所述第一数量的第一线性判别比中除所述第一线性判别比最大值和最小值以外的第一线性判别比,以得到第三数量的第一线性判别比;
和/或,所述对所述第二数量的第二线性判别比进行筛选,得到第四数量的第二线性判别比,所述第四数量小于所述第二数量,包括:
确定所述第二数量的第二线性判别比中第二线性判别比最大值和最小值;
选取所述第二数量的第二线性判别比中除所述第二线性判别比最大值和最小值以外的第二线性判别比,以得到第四数量的第二线性判别比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东优碧胜科技有限公司,未经广东优碧胜科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110055549.0/2.html,转载请声明来源钻瓜专利网。





