[发明专利]语音数据处理方法及装置、存储介质、电子设备有效
| 申请号: | 201711364085.1 | 申请日: | 2017-12-18 |
| 公开(公告)号: | CN108320733B | 公开(公告)日: | 2022-01-04 |
| 发明(设计)人: | 吴国兵;潘嘉 | 申请(专利权)人: | 上海科大讯飞信息科技有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/14;G10L25/90;G10L25/93 |
| 代理公司: | 北京维澳专利代理有限公司 11252 | 代理人: | 王立民 |
| 地址: | 200000 上海市浦东新区南*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 数据处理 方法 装置 存储 介质 电子设备 | ||
1.一种语音数据处理方法,其特征在于,所述方法包括:
获取用户输入的语音数据,所述语音数据包括成功唤醒智能终端的唤醒语音数据,以及表示操作意图的控制语音数据;
提取所述语音数据的声学层面特征和/或语义层面特征,所述声学层面特征用于表示用户的发音特征,所述语义层面特征用于表示所述语音数据的文本特征;
将所述声学层面特征和/或语义层面特征作为输入,经预先构建的语音判别模型处理后,确定所述唤醒语音数据是否为误唤醒数据;其中用于构建语音判别模型的样本唤醒语音数据的数据类型包括正例唤醒语音数据或者反例唤醒语音数据。
2.根据权利要求1所述的方法,其特征在于,获取所述唤醒语音数据的方式为:
判断预设时间段内是否连续采集到至少两条用于唤醒所述智能终端的语音数据;
如果所述预设时间段内连续采集到至少两条用于唤醒所述智能终端的语音数据,且所述至少两条用于唤醒所述智能终端的语音数据经当前唤醒模型处理后的得分值d满足以下条件:d2≤d<d1,则将所述至少两条用于唤醒所述智能终端的语音数据确定为所述唤醒语音数据,d1为第一唤醒得分门限值,d2为第二唤醒得分门限值。
3.根据权利要求1或2所述的方法,其特征在于,所述声学层面特征包括当前唤醒模型的声学得分,则提取所述语音数据的声学层面特征包括:
获取所述当前唤醒模型针对所述唤醒语音数据的每个语音单元输出的前N个识别结果;
若各语音单元的前N个识别结果中包含该语音单元的正确发音,则判定该语音单元的识别结果为识别正确;
根据各语音单元的识别结果,统计所述唤醒语音数据的识别准确度,作为所述当前唤醒模型的声学得分。
4.根据权利要求3所述的方法,其特征在于,
所述声学层面特征还包括基频均值、短时平均能量、短时过零率中的至少一个;
和/或,
所述声学层面特征还包括清浊序列特征,则提取所述语音数据的声学层面特征包括:将基频均值、短时平均能量、短时过零率中的至少一个作为输入,经预先构建的清浊分类器处理后,输出所述唤醒语音数据的清浊序列{a1,a2,…,ai,…,am},其中,ai表示所述唤醒语音数据的第i个音素对应的清浊类别;计算所述唤醒语音数据的清浊序列与所述唤醒语音数据对应的唤醒词的清浊序列之间的相似度,作为所述清浊序列特征;
和/或,
所述声学层面特征还包括音调序列特征,则提取所述语音数据的声学层面特征包括:将基频均值、短时平均能量、短时过零率中的至少一个作为输入,经预先构建的音调分类器处理后,输出所述唤醒语音数据的音调序列{b1,b2,…,bj,…,bn},其中,bj表示所述唤醒语音数据的第j个音节对应的音调类别;计算所述唤醒语音数据的音调序列与所述唤醒语音数据对应的唤醒词的音调序列之间的相似度,作为所述音调序列特征;
和/或,
所述声学层面特征还包括语音单元的时间特征,则提取所述语音数据的声学层面特征包括:统计所述唤醒语音数据的每个语音单元的持续时间;利用各语音单元的持续时间,计算时间均值以及时间方差,作为所述语音单元的时间特征;
和/或,
所述声学层面特征还包括声纹特征,则提取所述语音数据的声学层面特征包括:利用预先构建的声纹提取模型提取所述唤醒语音数据的i-vector特征,作为所述声纹特征;
和/或,
所述声学层面特征还包括能量分布特征,则提取所述语音数据的声学层面特征包括:将所述语音数据切分为三部分ct-1、ct、ct+1,统计各部分的平均能量分布,作为所述能量分布特征;其中,ct表示所述唤醒语音数据,ct+1表示在所述唤醒语音数据之后采集到的包括所述控制语音数据的语音数据集,ct-1表示在所述唤醒语音数据之前采集到的语音数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海科大讯飞信息科技有限公司,未经上海科大讯飞信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711364085.1/1.html,转载请声明来源钻瓜专利网。





