[发明专利]说话人角色识别方法、装置、电子设备及存储介质在审
| 申请号: | 202011033828.9 | 申请日: | 2020-09-27 |
| 公开(公告)号: | CN112233680A | 公开(公告)日: | 2021-01-15 |
| 发明(设计)人: | 吴峥;高天;王培养 | 申请(专利权)人: | 科大讯飞股份有限公司 |
| 主分类号: | G10L17/22 | 分类号: | G10L17/22;G10L17/02;G10L17/18;G10L25/24;G10L25/30;G10L25/63 |
| 代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李文清 |
| 地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 说话 角色 识别 方法 装置 电子设备 存储 介质 | ||
1.一种说话人角色识别方法,其特征在于,包括:
确定待识别的说话人语音片段的语音特征和声学特征;
基于所述声学特征,确定所述说话人语音属性特征;
基于所述语音特征和所述说话人语音属性特征,确定所述说话人语音片段对应的说话人角色。
2.根据权利要求1所述的说话人角色识别方法,其特征在于,所述确定待识别的说话人语音片段的语音特征和声学特征,具体包括:
确定所述说话人语音片段的声纹特征;
若所述声纹特征与指定角色的声纹特征匹配,则确定所述说话人语音片段对应的说话人角色为所述指定角色;
否则,确定待识别的说话人语音片段的语音特征和声学特征。
3.根据权利要求1所述的说话人角色识别方法,其特征在于,所述基于所述语音特征和所述说话人语音属性特征,确定所述说话人语音片段对应的说话人角色,具体包括:
将所述语音特征和所述说话人语音属性特征进行融合,并基于得到的融合结果,确定所述说话人语音片段对应于各个候选角色的置信度得分;
若所述说话人语音片段对应于任一候选角色的置信度得分大于等于预设置信度得分阈值,则确定所述说话人语音片段对应的说话人角色为所述任一候选角色;
否则,确定所述说话人语音片段的语音文本,并基于所述语音文本确定所述说话人语音片段对应的说话人角色。
4.根据权利要求3所述的说话人角色识别方法,其特征在于,所述基于得到的融合结果,确定所述说话人语音片段对应于各个候选角色的置信度得分,具体包括:
将所述融合结果输入至语音角色识别模型,得到由所述语音角色识别模型输出的所述说话人语音片段对应于各个候选角色的置信度得分;
所述语音角色识别模型用于提取所述融合结果中的局部声学特征以及上下文文本特征,并基于所述融合结果、所述局部声学特征以及所述上下文文本特征对所述说话人语音片段对应的说话人角色进行识别;
所述语音角色识别模型基于带有说话人角色标签的语音特征样本训练得到。
5.根据权利要求4所述的说话人角色识别方法,其特征在于,所述将所述融合结果输入至语音角色识别模型,得到由所述语音角色识别模型输出的所述说话人语音片段对应于各个候选角色的置信度得分,具体包括:
将所述融合结果分别输入至所述语音角色识别模型的局部声学特征提取层以及上下文文本特征提取层,得到由所述局部声学特征提取层输出的所述融合结果中的局部声学特征,以及由所述上下文文本特征提取层输出的所述融合结果中的上下文文本特征;
将所述融合结果、所述局部声学特征以及所述上下文文本特征输入至所述语音角色识别模型的特征拼接层,得到由所述特征拼接层输出的所述融合结果的高维特征;
将所述高维特征输入至所述语音角色识别模型的输出层,得到由所述输出层输出的所述说话人语音片段对应于各个候选角色的置信度得分。
6.根据权利要求1至5中任一项所述的说话人角色识别方法,其特征在于,所述基于所述声学特征,确定所述说话人语音属性特征,具体包括:
将所述声学特征中的梅尔频率倒谱系数特征输入至普通话评分模型,得到由所述普通话评分模型输出的所述说话人语音属性特征中的普通话评分特征;
将所述声学特征中的感知线性预测特征输入至情感评分模型,得到由所述情感评分模型输出的所述说话人语音属性特征中的情感评分特征;
所述普通话评分模型基于携带有普通话评分标签的梅尔频率倒谱系数特征训练得到,所述情感评分模型基于携带有情感评分标签的感知线性预测特征训练得到。
7.根据权利要求1至5中任一项所述的说话人角色识别方法,其特征在于,所述语音特征具体包括:声学层面和文本层面上的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011033828.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种自锁螺母自动加工设备
- 下一篇:一种内外双向稳定的汽车轮胎用智能夹具





