[发明专利]语音信号处理方法、设备及存储介质在审
| 申请号: | 202010581908.1 | 申请日: | 2020-06-23 |
| 公开(公告)号: | CN111768800A | 公开(公告)日: | 2020-10-13 |
| 发明(设计)人: | 曹刚 | 申请(专利权)人: | 中兴通讯股份有限公司 |
| 主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/24;G10L25/78;G10L15/05;G10L15/02 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 洪铭福 |
| 地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 信号 处理 方法 设备 存储 介质 | ||
本申请实施例涉及语音信号处理方法、设备及存储介质。本申请实施例包括:获取待检测帧的音频特征;获取语音信号中所述待检测帧之前预设长度时间窗内的静音点占比;根据所述音频特征确定静音点占比阈值;根据所述静音点占比和所述静音点占比阈值判断所述待检测帧是否是尾点帧。本申请实施例能够利用预设长度时间窗内静音点占比,并使用当前待检测帧的倒频谱特征来动态调节静音点占比阈值,从而克服了固定静音点占比阈值存在的语音尾点检测不准确的问题,有效提高了尾点帧检测的准确性和实时性。
技术领域
本申请实施例涉及但不限于计算机技术领域,尤其涉及一种语音信号处理方法、设备及存储介质。
背景技术
随着人工智能的发展,语音识别成为众多设备的标配,语音识别是以语音为研究对象,通过语音信号处理和模式识别让机器自动识别和理解人类口述的语言。
语音尾点检测在语音识别中起着关键性作用,语音尾点检测即在音频数据中找到语音的尾点,其准确性对语音识别的准确性起着至关重要的作用。
目前,语音尾点检测存在语音尾点不易确定的问题,使语音识别的准确率大大降低。
发明内容
本申请实施例提供了语音信号处理方法、设备及存储介质,能够提高语音尾点检测和识别的准确率。
第一方面,本申请实施例提供了一种语音信号处理方法,包括:获取语音信号中待检测帧的音频特征;获取待检测帧之前预设长度时间窗内的静音点占比;根据所述音频特征得到静音点占比阈值;根据所述静音点占比和所述静音点占比阈值,确定所述语音信号中的尾点帧。
第二方面,本申请实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一方面中所述的语音信号处理方法。
第三方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可执行指令用于执行第一方面中所述的语音信号处理方法。
本申请实施例包括:获取语音信号中待检测帧的音频特征;获取所述待检测帧之前预设长度时间窗内的静音点占比;根据所述音频特征确定静音点占比阈值;根据所述静音点占比和所述静音点占比阈值确定所述待检测帧是尾点帧。本申请实施例能够利用预设长度时间窗内静音点占比,并使用当前待检测帧的倒频谱特征来动态调节静音点占比阈值,从而克服了固定静音点占比阈值存在的语音尾点检测不准确的问题,有效提高了尾点帧检测的准确性和实时性。
本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
图1是本申请一实施例提供的语音信号处理方法流程图;
图2是本申请另一实施例提供的语音信号处理方法流程图;
图3是本申请另一实施例提供的语音信号处理方法流程图;
图4是本申请另一实施例提供的语音信号处理方法流程图;
图5是本申请另一实施例提供的语音信号处理方法流程图;
图6是本申请一实施例提供的语音识别方法流程图;
图7是本申请一实施例提供的语音尾点检测设备示意图;
图8是本申请一实施例提供的语音尾点检测装置示意图;
图9是本申请一实施例提供的语音识别装置示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010581908.1/2.html,转载请声明来源钻瓜专利网。





