[发明专利]基于统计模型的语音端点检测方法及装置有效
申请号: | 201510587721.1 | 申请日: | 2015-09-15 |
公开(公告)号: | CN105261357B | 公开(公告)日: | 2016-11-23 |
发明(设计)人: | 贺利强;潘复平 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/05 | 分类号: | G10L15/05;G10L21/02;G10L15/04 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于统计模型的语音端点检测方法及装置,其中,该方法包括:接收输入的待检测语音信号;分帧提取待检测语音信号的第一语音特征信息,并对第一语音特征信息进行抗噪处理,以生成待检测语音信号的第二语音特征信息;根据第二语音特征信息和声学模型生成待检测语音信号的识别结果;根据识别结果和预设静音检测算法初步检测出待检测语音信号的语音端点;以及计算待检测语音信号的置信度信息,并根据置信度信息对语音端点进行调整。本发明实施例的基于统计模型的语音端点检测方法,准确定位了待检测语音信号的语音端点,提高了语音端点检测的准确率,进而可提高语音识别的准确性,提高语音识别的性能。 | ||
搜索关键词: | 基于 统计 模型 语音 端点 检测 方法 装置 | ||
【主权项】:
一种基于统计模型的语音端点检测方法,其特征在于,包括以下步骤:接收输入的待检测语音信号;分帧提取所述待检测语音信号的第一语音特征信息,并对所述第一语音特征信息进行抗噪处理,以生成所述待检测语音信号的第二语音特征信息;根据所述第二语音特征信息和声学模型生成所述待检测语音信号的识别结果;根据所述识别结果和预设静音检测算法初步检测出所述待检测语音信号的语音端点;以及计算所述待检测语音信号的置信度信息,并根据所述置信度信息对所述语音端点进行调整。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510587721.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种说话人识别方法
- 下一篇:屏幕检测装置及其检测方法