[发明专利]一种语音记录方法、装置、电子设备及存储介质在审
| 申请号: | 202011576937.5 | 申请日: | 2020-12-28 |
| 公开(公告)号: | CN112767941A | 公开(公告)日: | 2021-05-07 |
| 发明(设计)人: | 刘微微;赵之砚 | 申请(专利权)人: | 深圳壹账通智能科技有限公司 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L17/00 |
| 代理公司: | 北京中强智尚知识产权代理有限公司 11448 | 代理人: | 黄耀威 |
| 地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 记录 方法 装置 电子设备 存储 介质 | ||
1.一种语音记录方法,其特征在于,步骤包括:
获取第一段语音信息,并确定所述第一段语音信息的第一声源位置和第一声纹特征;
将所述第一段语音信息转译为文本内容,添加至第一发言人的发言记录中,将所述第一声源位置、所述第一声纹特征与所述第一发言人关联存储至数据库中;
获取第二段语音信息,并确定所述第二段语音信息的第二声源位置和第二声纹特征;
将所述第二声源位置与数据库存储的第一声源位置进行比对确定声源匹配因子,以及,将所述第二声纹特征与数据库存储的第一声纹特征进行比对确定声纹匹配因子;
将比对后的声源匹配因子和声纹匹配因子输入至联合模型中进行识别判断,输出所述第二段语音信息是否属于第一发言人;
如果属于第一发言人,则将所述第二段语音信息转译为文本内容,添加至所述第一发言人的发言记录中;
如果不属于第一发言人,则将所述第二段语音信息转译为文本内容,添加至新的发言人的发言记录中,并将所述第二声源位置、第二声纹特征与新的发言人进行关联后存储至数据库中;
获取下一段语音信息,并得到对应的声源匹配因子和对应的声纹匹配因子,并将对应的声源匹配因子和对应的声纹匹配因子输入至联合模型进行再次识别判断,直至语音收录结束。
2.根据权利要求1所述的方法,其特征在于,所述联合模型包括输入层、声源判断层、声纹判断层和输出层,所述将比对后的声源匹配因子和声纹匹配因子输入至联合模型中进行识别判断,输出所述第二段语音信息是否属于第一发言人,具体包括:
将所述声源匹配因子和所述声纹匹配因子从输入层输入;
利用所述声源判断层对所述声源匹配因子进行判断,当所述声源匹配因子≥声源阈值时,确定结果为声源匹配成功并发送至所述输出层,否则确定结果为声源匹配失败并发送至所述输出层;
利用所述声纹判断层对所述声纹匹配因子进行判断,当所述声纹匹配因子≥声纹阈值时,确定结果为声纹匹配成功并发送至所述输出层,否则确定结果为声纹匹配失败并发送至所述输出层;
当所述输出层接收到所述声源匹配成功和/或所述声纹匹配成功后,确定所述第二段语音信息属于第一发言人并输出,否则输出结果为空。
3.根据权利要求1或2所述的方法,其特征在于,在所述将比对后的声源匹配因子和声纹匹配因子输入至联合模型中进行识别判断,输出所述第二段语音信息是否属于第一发言人之前,所述方法还包括:
预先获取多个样本组合,其中,每个样本组合中包含有样本声源匹配因子和样本声纹匹配因子;
构建具有初始输入层、初始声源判断层、初始声纹判断层和初始输出层的初始联合模型;
为所述初始声源判断层设置声源初始阈值,为所述声纹判断层设置初始声纹阈值;
将一个样本组合中的样本声源匹配因子和样本声纹匹配因子通过所述初始输入层进行输入,所述输入层将所述样本声源匹配因子发送至所述初始声源判断层,将所述样本声纹匹配因子发送至所述初始声纹判断层;
所述初始声源判断层判断是否所述样本声源匹配因子≥声源初始阈值是则输出样本声源匹配成功发送至所述初始输出层,否则输出样本声源匹配失败发送至所述初始输出层;
所述初始声纹判断层判断是否所述样本声纹匹配因子≥声纹初始阈值是则输出样本声纹匹配成功发送至所述初始输出层,否则输出样本声纹匹配失败发送至所述初始输出层;
所述初始输出层接收到所述样本声源匹配成功和/或所述样本声纹匹配成功时,输出结果为属于同一个人,并将下一个样本组合输入至初始联合模型进行处理,否则输出结果为空,利用对应处理的样本组合的样本声源匹配因子替换所述声源初始阈值,利用对应处理的样本组合的样本声纹匹配因子替换所述声纹初始阈值,再将下一个样本组合输入至初始联合模型进行训练处理;
当所述初始联合模型对所有的样本组合全部训练处理完成后,将所述初始联合模型作为联合模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳壹账通智能科技有限公司,未经深圳壹账通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011576937.5/1.html,转载请声明来源钻瓜专利网。





