[发明专利]语音指令识别方法、装置、可读存储介质和电子设备在审
| 申请号: | 202010515168.1 | 申请日: | 2020-06-08 |
| 公开(公告)号: | CN111833867A | 公开(公告)日: | 2020-10-27 |
| 发明(设计)人: | 袁龙;王飞 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
| 主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/02;G10L17/02;G10L17/00 |
| 代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
| 地址: | 100193 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 指令 识别 方法 装置 可读 存储 介质 电子设备 | ||
1.一种语音指令识别方法,其特征在于,所述方法包括:
确定待处理语音信息,所述待处理语音信息包括多个帧;
确定所述待处理语音信息的语音特征信息序列,所述语音特征信息序列包括所述待处理语音信息中各帧的语音特征信息;
根据所述语音特征信息序列确定所述待处理语音信息中各帧对应的帧特征;
将各所述帧特征输入预先训练的字识别模型,以确定各帧的特征字概率向量,所述特征字概率向量包括所述帧特征与各预设特征字的匹配概率;
根据各帧的特征字概率向量确定所述待处理语音信息的概率向量序列;
根据具有预设长度的滑动搜索窗搜索所述概率向量序列,以确定所述滑动搜索窗内的概率向量子序列与预设指令词的第一匹配结果,其中,所述预设指令词包括以预定顺序排列的至少两个预设特征字;
根据所述第一匹配结果进行声纹匹配以确定语音指令识别结果。
2.根据权利要求1所述的方法,其特征在于,所述确定待处理语音信息包括:
响应于接收到任务信息,获取预设时长的语音信息;
对所述预设时长的语音信息进行预处理,以确定所述待处理语音信息。
3.根据权利要求1所述的方法,其特征在于,所述确定所述待处理语音信息的语音特征信息序列具体为:
分别对所述待处理语音信息中的各帧提取Fbank特征作为语音特征信息,以确定语音特征信息序列。
4.根据权利要求1所述的方法,其特征在于,所述根据所述语音特征信息序列确定所述待处理语音信息中各帧对应的帧特征包括:
确定目标帧;
确定在时间轴上与所述目标帧存在预定位置关系的至少一个关联帧;
根据所述目标帧的语音特征信息和所述关联帧的语音特征信息确定所述目标帧的帧特征。
5.根据权利要求4所述的方法,其特征在于,所述根据所述语音特征信息序列确定所述待处理语音信息中各帧对应的帧特征还包括:
响应于在时间轴上与所述目标帧存在预定位置关系的关联帧数量比预定数量少P帧,增加P个空帧作为关联帧,P为不小于等于1的整数。
6.根据权利要求1所述的方法,其特征在于,所述根据具有预设长度的滑动搜索窗搜索所述概率向量序列,以确定所述滑动搜索窗内的概率向量子序列与预设指令词的第一匹配结果包括:
以迭代方式执行如下步骤:
确定当前滑动搜索窗;
根据所述当前滑动搜索窗在时间轴上的位置确定对应的概率向量子序列;
计算所述当前滑动搜索窗对应的概率向量子序列的置信度;
响应于所述置信度不小于预设阈值,确定所述当前滑动搜索窗内的概率向量子序列与预设指令词匹配;
响应于所述置信度小于预设阈值,进入下一次循环。
7.根据权利要求6所述的方法,其特征在于,所述计算所述当前滑动搜索窗对应的概率向量子序列的置信度包括:
根据所述当前滑动搜索窗的概率向量子序列中的各所述特征字概率向量确定各所述特征字在所述当前滑动搜索窗中的特征值;
将各所述特征值输入预设函数以确定置信度。
8.根据权利要求7所述的方法,其特征在于,所述根据所述当前滑动搜索窗的概率向量子序列中的各所述特征字概率向量确定各所述特征字在所述当前滑动搜索窗中的特征值包括:
根据预定顺序在所述预设指令词中确定目标特征字;
响应于所述目标特征字是所述预设指令词中的第一个预设特征字,对比所述当前滑动搜索窗内各帧的特征字概率向量中所述目标特征字的匹配概率,与前一帧的特征字概率向量中与所述目标特征字对应的匹配概率,将所述帧的匹配概率和前一帧对应的匹配概率中较大的匹配概率更新为所述帧对应的匹配概率,并确定所述更新后的匹配概率为目标匹配概率,以确定所述目标特征字对应的目标匹配概率序列;
确定所述目标匹配概率序列中的最后一个目标匹配概率为所述目标特征字对应的特征值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010515168.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:脐橙白兰地原料处理一体装置
- 下一篇:一种应用评价方法及应用平台服务器





