[发明专利]减少驾驶人语音唤醒指令词误触发的方法及装置有效
申请号: | 201710669617.6 | 申请日: | 2017-08-08 |
公开(公告)号: | CN108122556B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 胡亚光;栗强 | 申请(专利权)人: | 大众问问(北京)信息科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L21/0208 |
代理公司: | 北京鼎佳达知识产权代理事务所(普通合伙) 11348 | 代理人: | 刘铁生;孟阿妮 |
地址: | 100000 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 减少 驾驶人 语音 唤醒 指令 触发 方法 装置 | ||
1.一种减少驾驶人语音唤醒指令词误触发的方法,其特征在于,所述方法包括:
对接收的语音信号进行语音活动检测,过滤掉语音信号中非人声区得到过滤后的语音信号;
获取过滤后的语音信号对应文本中包含的语音唤醒指令词的第一后验概率,所述第一后验概率为将一段语音信号识别为语音唤醒词的概率;
根据所述语音唤醒指令词以及所述语音唤醒指令词的第二后验概率来计算所述语音唤醒指令词的置信度,所述第二后验概率为所述语音信号对应被识别成的文本中每个字的后验概率;
根据所述第一后验概率以及所述置信度确定所述语音唤醒指令词是否为驾驶人语音唤醒指令词,包括:综合所述第一后验概率和所述置信度两个因素,将所述两个因素进行加权求和,根据所述加权求和之后的结果与一个预设阈值比较,将符合比较规则的所述加权求和之后的结果对应的语音唤醒指令词确定为驾驶人语音唤醒指令词。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据常用驾驶人的声音特征建立声纹识别模型;
根据所述声纹识别模型将所述过滤后的语音信号中的声音特征与所述常用驾驶人的声音特征进行匹配,得到过滤后的语音信号的声纹评分。
3.根据权利要求2所述的方法,其特征在于,所述根据所述第一后验概率以及所述置信度确定所述语音唤醒指令词是否为驾驶人语音唤醒指令词,包括:
根据所述语音信号的声纹评分、所述第一后验概率以及所述置信度确定所述语音唤醒指令词是否为驾驶人语音唤醒指令词。
4.根据权利要求1-3中任一项所述的方法,其特征在于,在对接收的语音信号进行语音活动检测,过滤掉语音信号中非人声区得到过滤后的语音信号之前,所述方法还包括:
以帧为单位计算所述语音信号的能量值和信噪比;
将能量值小于预设能量阈值或者信噪比小于预设预设信噪比阈值的帧从所述语音信号中滤除。
5.根据权利要求4所述的方法,其特征在于,所述获取过滤后的语音信号对应文本中包含的语音唤醒指令词的第一后验概率包括:
将过滤后的语音信号输入到语音识别解码模型,得到所述语音唤醒指令词的第二后验概率,所述第二后验概率为所述语音信号对应被识别成的文本中每个字的后验概率;
根据第二后验概率计算由字组成的语音唤醒指令词的第一后验概率。
6.根据权利要求5所述的方法,其特征在于,所述确定所述语音唤醒指令词是否为驾驶人语音唤醒指令词包括:
对所述语音唤醒指令词的第一后验概率以及所述语音唤醒指令词的置信度进行加权求和得到每个语音唤醒指令词的识别得分;或,对所述语音唤醒指令词的第一后验概率、所述语音唤醒指令词的置信度以及所述语音信号的声纹评分进行加权求和得到每个语音唤醒指令词的识别得分;
将识别得分与预设得分阈值进行比较;
若识别得分大于所述预设得分阈值,则将识别得分对应的语音唤醒指令词确定为驾驶人语音唤醒指令词。
7.一种减少驾驶人语音唤醒指令词误触发的装置,其特征在于,所述装置包括:
语音活动检测单元,用于对接收的语音信号进行语音活动检测,过滤掉语音信号中非人声区得到过滤后的语音信号;
获取单元,用于获取过滤后的语音信号对应文本中包含的语音唤醒指令词的第一后验概率,所述第一后验概率为将一段语音信号识别为语音唤醒词的概率;
置信度计算单元,用于根据所述语音唤醒指令词以及所述语音唤醒指令词的第二后验概率来计算所述语音唤醒指令词的置信度,所述第二后验概率为所述语音信号对应被识别成的文本中每个字的后验概率;
确定单元,用于根据所述第一后验概率以及所述置信度确定所述语音唤醒指令词是否为驾驶人语音唤醒指令词,包括:综合所述第一后验概率和所述置信度两个因素,将所述两个因素进行加权求和,根据所述加权求和之后的结果与一个预设阈值比较,将符合比较规则的所述加权求和之后的结果对应的语音唤醒指令词确定为驾驶人语音唤醒指令词。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大众问问(北京)信息科技有限公司,未经大众问问(北京)信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710669617.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:通讯方法、语音识别设备和终端设备
- 下一篇:基于声纹识别的车载多媒体导航终端