[发明专利]语音类别的识别方法、装置、电子设备及可读存储介质在审
| 申请号: | 202010867251.5 | 申请日: | 2020-08-26 |
| 公开(公告)号: | CN112002306A | 公开(公告)日: | 2020-11-27 |
| 发明(设计)人: | 谷姗姗;纪诚;刘斌彬 | 申请(专利权)人: | 阳光保险集团股份有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/16;G10L15/06;G06N3/04;G06N3/08 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 毕翔宇 |
| 地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 类别 识别 方法 装置 电子设备 可读 存储 介质 | ||
1.一种语音类别的识别方法,其特征在于,所述识别方法包括:
将获取到的待识别语音转换为相应的待识别语句;
确定所述待识别语句在每个特征维度下对应的语句特征;
基于确定出的多个所述语句特征,构建所述待识别语音的多维特征矩阵;
将所述多维特征矩阵输入至训练好的分类模型中,确定出所述待识别语音所属类别。
2.根据权利要求1所述的识别方法,其特征在于,所述基于确定出的多个所述语句特征,构建所述待识别语音的多维特征矩阵,包括:
将确定出的每个语句特征转换为相应的语句特征向量;
将得到的多个语句特征向量按照每两个语句特征之间的关联关系,构建所述待识别语句对应的多维特征矩阵。
3.根据权利要求1所述的识别方法,其特征在于,通过以下步骤训练所述分类模型:
获取多个样本识别语音,以及每个样本识别语音对应的真实类别标签;
针对于每个样本识别语音,将所述样本识别语音转换为相应的样本识别语句;
确定所述样本识别语句在每个特征维度下对应的样本特征;
基于确定出的多个样本特征,构建所述样本识别语音的多维样本矩阵;
将每个样本识别语音的多维样本矩阵作为输入特征,将每个样本识别语音对应的真实类别标签作为输出特征,训练构建好的卷积神经网络,得到训练好的分类模型。
4.根据权利要求3所述的识别方法,其特征在于,所述将每个样本识别语音的多维样本矩阵作为输入特征,将每个样本识别语音对应的真实类别标签作为输出特征,训练构建好的卷积神经网络,得到训练好的分类模型,包括:
将每个样本识别语音的多维样本矩阵输入至构建好的卷积神经网络中,得到每个样本识别语音的预测类别标签;
基于每个样本识别语音的预测类别标签以及每个样本识别语音对应的真实类别标签,确定所述卷积神经网络的损失值;
当所述损失值到达预设阈值时,确定所述卷积神经网络训练完毕,得到训练好的分类模型。
5.根据权利要求1所述的识别方法,其特征在于,所述语句特征包括字特征、拼音特征以及音调特征。
6.一种语音类别的识别装置,其特征在于,所述识别装置包括:
转换模块,用于将获取到的待识别语音转换为相应的待识别语句;
特征确定模块,用于确定所述待识别语句在每个特征维度下对应的语句特征;
矩阵构建模块,用于基于确定出的多个所述语句特征,构建所述待识别语音的多维特征矩阵;
类别确定模块,用于将所述多维特征矩阵输入至训练好的分类模型中,确定出所述待识别语音所属类别。
7.根据权利要求6所述的识别装置,其特征在于,所述矩阵构建模块在用于基于确定出的多个所述语句特征,构建所述待识别语音的多维特征矩阵时,所述矩阵构建模块用于:
将确定出的每个语句特征转换为相应的语句特征向量;
将得到的多个语句特征向量按照每两个语句特征之间的关联关系,构建所述待识别语句对应的多维特征矩阵。
8.根据权利要求6所述的识别装置,其特征在于,所述识别装置还包括模型训练模块,所述模型训练模块用于:
获取多个样本识别语音,以及每个样本识别语音对应的真实类别标签;
针对于每个样本识别语音,将所述样本识别语音转换为相应的样本识别语句;
确定所述样本识别语句在每个特征维度下对应的样本特征;
基于确定出的多个样本特征,构建所述样本识别语音的多维样本矩阵;
将每个样本识别语音的多维样本矩阵作为输入特征,将每个样本识别语音对应的真实类别标签作为输出特征,训练构建好的卷积神经网络,得到训练好的分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阳光保险集团股份有限公司,未经阳光保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010867251.5/1.html,转载请声明来源钻瓜专利网。





