[发明专利]一种声码器余量谱幅度参数重构方法及系统有效
申请号: | 201910800781.5 | 申请日: | 2019-08-28 |
公开(公告)号: | CN110610713B | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 颜夕宏;张生平;王主磊;吴子晧;颜明 | 申请(专利权)人: | 南京梧桐微电子科技有限公司 |
主分类号: | G10L19/087 | 分类号: | G10L19/087;G10L13/04;G10L25/30 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210042 江苏省南京市玄*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种声码器余量谱幅度参数重构方法及系统,获取声码器解码端输入的线谱频率参数、带通浊音度参数、基音周期参数、能量参数,根据所获取的参数获取初步合成语音;将初步合成语音转换为图像矩阵,输入至已训练好的深度卷积网络得到量化索引;根据所述量化索引搜索预生成的余量谱幅度参数码本,得到重构的余量谱幅度参数;对重构的余量谱幅度参数以及所获取的线谱频率参数、带通浊音度参数、基音周期参数、能量参数进行合成得到最终合成语音。优点:余量谱幅度参数不进性编码传输,在声码器工作时,通过训练生成的深度卷积网络对余量谱幅度参数进行重构,在保证语音可懂度的同时,进一步提高了合成语音的自然度。 | ||
搜索关键词: | 一种 声码 余量 幅度 参数 方法 系统 | ||
【主权项】:
1.一种声码器余量谱幅度参数重构方法,其特征在于,/n获取声码器解码端输入的线谱频率参数、带通浊音度参数、基音周期参数、能量参数,根据所获取的参数获取初步合成语音;/n将初步合成语音转换为图像矩阵,输入至已训练好的深度卷积网络得到量化索引;/n根据所述量化索引搜索预生成的余量谱幅度参数码本,得到重构的余量谱幅度参数;/n对重构的余量谱幅度参数以及所获取的线谱频率参数、带通浊音度参数、基音周期参数、能量参数进行合成得到最终合成语音。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京梧桐微电子科技有限公司,未经南京梧桐微电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910800781.5/,转载请声明来源钻瓜专利网。