[发明专利]对话音频数据处理方法、电子设备和计算机可读存储介质有效
申请号: | 202110340458.1 | 申请日: | 2021-03-30 |
公开(公告)号: | CN112966090B | 公开(公告)日: | 2022-07-12 |
发明(设计)人: | 邹平;俞凯 | 申请(专利权)人: | 思必驰科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F21/32;G06F21/62 |
代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对话 音频 数据处理 方法 电子设备 计算机 可读 存储 介质 | ||
1.一种对话音频数据处理方法,包括:
获取对话音频数据;
分离所述对话音频数据中的多个说话人的多份语音数据;
对所述多份语音数据分别做生物特征处理;
根据生物特征处理后的所述多份语音数据生成新的对话音频数据;
在对所述多份语音数据分别做生物特征处理之前,对所述多份语音数据分别做对话内容脱敏处理;
对所述对话音频数据或者所述多份语音数据进行语音识别得到对应于多个说话人的多份原始识别文本信息;
对生物特征处理后的所述多份语音数据进行语音识别得到多份新的识别文本信息;
计算所述多份原始识别文本信息和所述多份新的识别文本信息中成对识别文本信息中除脱敏处理部分之外部分之间的相似度,得到多个文本相似度值;
当所述文本相似度值均大于第三预设阈值时,确定所述生物特征处理合格;否则,确定所述生物特征处理不合格。
2.根据权利要求1所述的方法,其特征在于,所述生物特征处理包括:声纹特征处理和年龄特征处理中的至少一种。
3.根据权利要求1所述的方法,其特征在于,还包括:
提取所述多份语音数据的多份原始生物特征信息;
提取生物特征处理后的所述多份语音数据的多份新的生物特征信息;
计算所述多份原始生物特征信息和所述多份新的生物特征信息中成对生物特征信息之间的相似度,得到多个生物特征相似度值;
当所述多个生物特征相似度值均小于第一预设阈值时,确定所述生物特征处理合格;否则,确定所述生物特征处理不合格。
4.根据权利要求1所述的方法,其特征在于,还包括:
对所述对话音频数据或者所述多份语音数据进行语音识别得到对应于多个说话人的多份原始识别文本信息;
对生物特征处理后的所述多份语音数据进行语音识别得到多份新的识别文本信息;
计算所述多份原始识别文本信息和所述多份新的识别文本信息中成对识别文本信息之间的相似度,得到多个文本相似度值;
当所述文本相似度值均大于第二预设阈值时,确定所述生物特征处理合格;否则,确定所述生物特征处理不合格。
5.根据权利要求1-4中任一项所述的方法,其特征在于,还包括:
存储所述多个说话人的多份样本语音数据,并建立所述多个说话人与生物特征处理后的多份语音数据之间的映射关系,用于当需要播放新的对话音频数据时,从新的对话音频数据中分离出待播放的生物特征处理后的多份语音数据,并根据所述映射关系确定对应于所述待播放的生物特征处理后的多份语音数据所对应的多份样本语音数据,根据所述多份样本语音数据还原所述待播放的生物特征处理后的多份语音数据。
6.根据权利要求5所述的方法,其特征在于,根据所述多份样本语音数据还原所述待播放的生物特征处理后的多份语音数据,包括:
对所述待播放的生物特征处理后的多份语音数据进行语音识别处理得到待播放的多份识别文本信息;
根据所述多份样本语音数据的特征信息合成对应于所述待播放的多份识别文本信息的多份播放语音数据。
7.一种电子设备,其包括:至少一个处理器,以及与所述至少一个处理器通信连接的存储器,其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任意一项所述方法的步骤。
8.一种存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-6中任意一项所述方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110340458.1/1.html,转载请声明来源钻瓜专利网。