[发明专利]信息处理方法及装置、电子设备及存储介质有效
申请号: | 201810068595.2 | 申请日: | 2018-01-24 |
公开(公告)号: | CN108198566B | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 徐嵚嵛;李琳;周冰 | 申请(专利权)人: | 咪咕文化科技有限公司;中国移动通信集团有限公司 |
主分类号: | G10L21/007 | 分类号: | G10L21/007;G10L25/24;G10L21/013 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王姗姗;张颖玲 |
地址: | 100032 北京市西城区德*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 信息处理 方法 装置 电子设备 存储 介质 | ||
1.一种信息处理方法,其特征在于,包括:
提取源语音的第一频域特征;
提取目标语音的第二频域特征;
基于所述第一频域特征及所述第二频域特征,构建高斯模型;
将位于第一空间的所述第一频域特征和所述第二频域特征,通过非线性映射映射到第二空间,其中,所述第二空间的维度高于所述第一空间的维度;
对映射到所述第二空间的频域特征进行核非负矩阵进行分解,得到第一转换函数;
将所述第一转换函数和所述高斯模型进行混合,得到第二转换函数,其中,所述第二转换函数,用于将所述源语音的声音参数转换为所述目标语音的声音特征参数;
其中,所述将所述第一转换函数和所述高斯模型进行混合,得到第二转换函数,包括:将所述第一转换函数与所述高斯模型的高斯分量的后验概率相乘得到所述第二转换函数;
其中,所述将所述第一转换函数与所述高斯模型的高斯分量的后验概率相乘得到所述第二转换函数,包括:对所述高斯模型的高斯分量的第一后验概率进行平滑处理,得到平滑处理后的第二后验概率;将所述第一转换函数及所述第二后验概率相乘,以获得所述第二转换函数;
其中,所述对所述高斯模型的高斯分量的第一后验概率进行平滑处理,得到平滑处理后的第二后验概率,包括:根据滤波窗内所有帧的后验概率的中值与滤波窗内所有帧的后验概率的最小值、最大值的差值,以及当前帧的所述第一后验概率与滤波窗内所有帧的后验概率的最小值、最大值的差值,确定平滑处理后的第二后验概率。
2.根据权利要求1所述的方法,其特征在于,
所述提取源语音的第一频域特征,包括:
提取源语音的第一频域特征其中,为所述源语音的第t帧的频域特征;为所述源语音的第t-1帧的频域特征;为所述源语音的第t+1帧的频域特征;
所述提取目标语音的第二频域特征,包括:
获取目标语音的第二频域特征其中,为所述目标语音的第t帧的频域特征;为所述目标语音的第t-1帧的频域特征;为所述目标语音的第t+1帧的频域特征。
3.根据权利要求1或2所述的方法,其特征在于,
所述第一频域特征为所述源语音的梅尔频率倒谱系数特征;
所述第二频域特征为所述目标语音的梅尔频率倒谱系数特征。
4.根据权利要求1所述的方法,其特征在于,
所述对所述高斯模型的高斯分量的第一后验概率进行平滑处理,得到平滑处理后的第二后验概率,包括:
利用如下函数对所述高斯分量的第一后验概率进行处理,以获得所述第二后验概率;
A1=Pmed-Pmin
A2=Pmed-Pmax,其中,Pcur为当前帧的所述第一后验概率;Pmin为滤波窗内所有帧的后验概率中的最小值,Pmax为所述滤波窗内所有帧的后验概率中的最大值;Pmed为所述滤波窗内所有帧的后验概率中的中值;
若A10,A20,则利用如下函数后续处理,
B1=Pcur-Pmin
B2=Pcur-Pmax
B10,B20,则将Pcur作为所述第二后验概率输出,否则将Pmed作为平滑处理后的所述第二后验概率。
5.根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
获取第一语音;
利用所述第二转换函数对所述第一语音进行声音特征转变,得到与所述第一语音语义内容相同且声音特征不同的第二语音。
6.根据权利要求5所述的方法,其特征在于,
所述第一语音的发音对象为所述源语音的发音对象之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于咪咕文化科技有限公司;中国移动通信集团有限公司,未经咪咕文化科技有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810068595.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:混音处理方法、装置、计算机设备和存储介质
- 下一篇:一种新型语音除噪系统