[发明专利]用于检测语音尾点的方法和装置有效
申请号: | 201810958854.9 | 申请日: | 2018-08-22 |
公开(公告)号: | CN108877779B | 公开(公告)日: | 2020-03-20 |
发明(设计)人: | 张雪薇 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L15/26;G10L25/03 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 检测 语音 方法 装置 | ||
本申请实施例公开了用于检测语音尾点的方法和装置。该方法的一具体实施方式包括:响应于检测到音频流中的语音头点,确定目标音频帧序列中的音频帧对应的音频特征值,其中,该目标音频帧序列根据该音频流中的该语音头点之后的部分生成;对于该目标音频帧序列中的音频帧,将该音频帧对应的音频特征值导入预先建立的尾点检测模型,生成该音频帧的音频帧类型,其中,该尾点检测模型用于表征音频特征值与音频帧类型之间的对应关系;根据该目标音频帧序列中的音频帧的音频帧类型,确定该音频流中的语音尾点。该实施方式提供了新的检测语音尾点的方式。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于检测语音尾点的方法和装置。
背景技术
随着人工智能技术的发展,新型智能设备(例如智能音箱、智能交互机器人等)开始涌现,语音交互这种新型人机交互技术逐步被大众所接收,语音识别技术的重要性日益凸现。语音端点检测,即在连续的音频数据中找到语音的起点与尾点,是语音识别系统的重要组成部分,其准确性会对语音识别的准确性造成影响。
发明内容
本申请实施例提出了用于检测语音尾点的方法和装置。
第一方面,本申请实施例提供了一种用于检测语音尾点的方法,该方法包括:响应于检测到音频流中的语音头点,确定目标音频帧序列中的音频帧对应的音频特征值,其中,上述目标音频帧序列根据上述音频流中的上述语音头点之后的部分生成;对于上述目标音频帧序列中的音频帧,将该音频帧对应的音频特征值导入预先建立的尾点检测模型,生成该音频帧的音频帧类型,其中,上述尾点检测模型用于表征音频特征值与音频帧类型之间的对应关系;根据上述目标音频帧序列中的音频帧的音频帧类型,确定上述音频流中的语音尾点。
第二方面,本申请实施例提供了一种用于检测语音尾点的装置,该装置包括:第一确定单元,被配置成响应于检测到音频流中的语音头点,确定目标音频帧序列中的音频帧对应的音频特征值,其中,上述目标音频帧序列根据上述音频流中的上述语音头点之后的部分生成;生成单元,被配置成对于上述目标音频帧序列中的音频帧,将该音频帧对应的音频特征值导入预先建立的尾点检测模型,生成该音频帧的音频帧类型,其中,上述尾点检测模型用于表征音频特征值与音频帧类型之间的对应关系;第二确定单元,被配置成根据上述目标音频帧序列中的音频帧的音频帧类型,确定上述音频流中的语音尾点。
第三方面,本申请实施例提供了一种电子设备,该电子设备包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。
第四方面,本申请实施例提供了一种计算机可读介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时实现如第一方面中任一实现方式描述的方法。
本申请实施例提供的用于检测语音尾点的方法和装置,通过响应于检测到音频流中的语音头点,确定目标音频帧序列中的音频帧对应的音频特征值,对于上述目标音频帧序列中的音频帧,将该音频帧对应的音频特征值导入预先建立的尾点检测模型,生成该音频帧的音频帧类型,根据上述目标音频帧序列中的音频帧的音频帧类型,确定上述音频流中的语音尾点,技术效果至少可以包括:提供了新的检测语音尾点的方式。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本申请可以应用于其中的示例性系统架构图;
图2是根据本申请的用于检测语音尾点的方法的一个实施例的流程图;
图3是根据本申请的用于检测语音尾点的方法的一个应用场景的示意图;
图4是根据本申请的用于检测语音尾点的方法的又一个实施例的流程图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810958854.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音端点检测方法及设备
- 下一篇:一种语音搜题方法及家教设备