[发明专利]一种目标语种检测的方法和装置有效
| 申请号: | 201910780178.5 | 申请日: | 2019-08-22 |
| 公开(公告)号: | CN110491375B | 公开(公告)日: | 2022-02-01 |
| 发明(设计)人: | 阿里木·赛买提;褚繁;李晋;方昕;柳林;卡哈尔·卡迪尔;段雪明;彭小露 | 申请(专利权)人: | 新疆科大讯飞信息科技有限责任公司 |
| 主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/16;G10L15/06;G10L15/04;G10L15/22 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 郭化雨 |
| 地址: | 830009 新疆维吾尔自治区乌鲁木*** | 国省代码: | 新疆;65 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 目标 语种 检测 方法 装置 | ||
1.一种目标语种检测的方法,其特征在于,包括:
切分待识别语音数据的语种特征,获得多个语种特征段,所述待识别语音数据的语种特征对应多个语种,所述语种特征段对应一种语种;
将每个所述语种特征段输入多语种分类模型,获得每个所述语种特征段每一帧的C维语种得分向量;
针对每个所述语种特征段,获得所述每一帧的C维语种得分向量中目标语种与各个其他语种的得分差统计值组成向量α,所述得分差统计值包括得分差平均值、得分差中位值或得分差最小值;
基于每个所述向量α与全1向量β的相似度和相似度阈值,确定所述待识别语音数据是否包括所述目标语种。
2.根据权利要求1所述的方法,其特征在于,所述切分待识别语音数据的语种特征,获得多个语种特征段,具体为:
基于预设窗长L和预设窗移S切分所述待识别语音数据的语种特征,获得多个L帧语种特征段,S<L。
3.根据权利要求1所述的方法,其特征在于,所述针对每个所述语种特征段,获得所述每一帧的C维语种得分向量中目标语种与各个其他语种的得分差平均值组成向量α,包括:
针对每个所述语种特征段,基于所述每一帧的C维语种得分向量中目标语种得分与各个其他语种得分,获得所述每一帧的C维语种得分向量中目标语种与各个其他语种的得分差统计值;
将所述每一帧的C维语种得分向量中目标语种与各个其他语种的得分差统计值按照帧顺序组成所述向量α。
4.根据权利要求1所述的方法,其特征在于,所述基于每个所述向量α与全1向量β的相似度和相似度阈值,确定所述待识别语音数据是否包括所述目标语种,包括:
若至少一个所述向量α与全1向量β的相似度大于等于所述相似度阈值,确定所述待识别语音数据包括目标语种;
若各个所述向量α与全1向量β的相似度均小于所述相似度阈值,确定所述待识别语音数据不包括目标语种。
5.根据权利要求4所述的方法,其特征在于,还包括:
若至少一个所述向量α与全1向量β的相似度大于等于所述相似度阈值,将所述至少一个所述向量α对应的语种特征段确定为目标语种特征段;
基于所述目标语种特征段的切分信息,确定所述目标语种在所述待识别语音数据的位置。
6.根据权利要求5所述的方法,其特征在于,当待识别语音数据包括多个目标语种特征段,所述切分信息为切分起止边界时,所述基于所述目标语种特征段的切分信息,确定所述目标语种在所述待识别语音数据的位置,具体为:
若多个所述目标语种特征段中至少两个所述目标语种特征段对应的切分起止边界重叠,基于多个所述目标语种特征段对应的切分起止边界,合并至少两个所述目标语种特征段对应的切分起止边界,确定所述目标语种在所述待识别语音数据的位置。
7.根据权利要求1所述的方法,其特征在于,所述多语种分类模型训练步骤,包括:
基于C个不同语种的训练语音数据,获得每个所述训练语音数据的语种特征和对应的C维语种标签,C为正整数,C≥2,所述C维语种标签中每一维表示一个语种;
基于每个所述训练语音数据的语种特征和对应的C维语种标签,训练循环神经网络获得多语种分类模型。
8.根据权利要求7所述的方法,其特征在于,所述基于每个所述训练语音数据的语种特征和对应的C维语种标签,训练循环神经网络获得多语种分类模型,包括:
将每个所述训练语音数据的语种特征输入所述循环神经网络获得每个所述训练语音数据的语种特征每一帧的C维预测语种得分向量;
针对每个所述训练语音数据的语种特征,将各帧的C维预测语种得分向量进行帧平均处理,获得每个所述训练语音数据的语种特征的C维预测语种标签;
基于每个C维预测语种标签和对应的所述C维语种标签,获得所述循环神经网络的损失函数;
基于所述循环神经网络的损失函数更新所述循环神经网络的网络参数,获得所述多语种分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆科大讯飞信息科技有限责任公司,未经新疆科大讯飞信息科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910780178.5/1.html,转载请声明来源钻瓜专利网。





