[发明专利]一种基于直方图匹配的自适应实例规一化语音转换方法有效
| 申请号: | 202010417945.9 | 申请日: | 2020-05-18 |
| 公开(公告)号: | CN111599368B | 公开(公告)日: | 2022-10-18 |
| 发明(设计)人: | 简志华;朱雅楠;于佳祺;金易帆;孙闽红;钟华 | 申请(专利权)人: | 杭州电子科技大学 |
| 主分类号: | G10L19/00 | 分类号: | G10L19/00;G10L19/16 |
| 代理公司: | 浙江千克知识产权代理有限公司 33246 | 代理人: | 周希良 |
| 地址: | 310018 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 直方图 匹配 自适应 实例 规一化 语音 转换 方法 | ||
本发明公开了一种基于直方图匹配的自适应实例规一化语音转换方法,包括:S11.将源语音和目标语音分别输入至编码器中进行编码处理,分别得到语音内容信息和说话人信息;S12.将得到的语音内容信息和说话人信息分别输入自适应实例规一化AdaIN中进行均值和方差的对齐处理;S13.将经过自适应实例规一化AdaIN处理后的语音内容信息和说话人信息通过解码器进行解码,得到解码后的转换语音;S14.将解码后的转换语音输入直方图匹配算法中进行处理,得到最终转换后的语音。本发明将语音的内容信息与说话人信息分开处理,并用直方图进行匹配优化,从而达到训练一个模型完成一对多的语音转换的目的。
技术领域
本发明涉及语言转化技术领域,尤其涉及一种基于直方图匹配的自适应实例规一化语音转换方法。
背景技术
语音转换技术是指将源说话人的身份信息转换为目标说话人的身份信息,同时保持语音内容不变,简单地说就是将一个说话人(称之为源)的声音,通过某种手段进行变换,使其听起来仿佛是另一个说话人(称之为目标)说的话。语音转换属于交叉性的学科分支,其内容既涉及到语音学、语义学及心理声学等领域的知识,又涵盖语音信号处理领域的各个方面,如语音的分析与合成、说话人识别、语音编码和增强等。现阶段,语音转换技术在医疗服务、保密通信及生活娱乐的方面有着非常重要的应用。目前,语音转换可以大致分为两类,一类是受监督的,另一类是无监督的。受监督的语音转换已经取得了较好的成果,但是需要源语音与目标语音之间相应语音帧对齐,如果源语音与目标语音之间有巨大差异,就无法达到较好的转换效果,这也限制了其应用推广。
如公开号为CN102737628A的专利公开了一种基于LPC及RBF神经网络的声音转换的方法,包括以下步骤:A、对语音进行预处理;B、对浊音帧进行基频检测;C、对基频检测后的浊音帧进行转换;D、对转换后的基频进行浊音帧参量的提取;E、对提取到的浊音帧参量进行计算,求得一帧浊音帧,然后对该一帧浊音帧进行合成,得到转换后的浊音帧。上述申请提出了一种高质量、计算量适中的语音转换技术方案,但其不足之处在于:该申请案的一种基于LPC及RBF神经网络的声音转换的方法,将待转换语音分解成清音和浊音,又将浊音分成基频、能量、LPC及LSF系数进行语音转换,增加了能量的测量,增大了测量难度和误差,易造成转换后的语音质量不理想的问题。
针对上述技术问题,本发明提出一种基于直方图匹配的自适应实例规一化语音转换方法来解决上述问题。
发明内容
本发明的目的是针对现有技术的缺陷,提供了一种基于直方图匹配的自适应实例规一化语音转换方法。
为了实现以上目的,本发明采用以下技术方案:
一种基于直方图匹配的自适应实例规一化语音转换方法,包括:
S1.将源语音和目标语音分别输入至编码器中进行编码处理,分别得到语音内容信息和说话人信息;
S2.将得到的语音内容信息和说话人信息分别输入自适应实例规一化AdaIN中进行均值和方差的对齐处理;
S3.将经过自适应实例规一化AdaIN处理后的语音内容信息和说话人信息通过解码器进行解码,得到解码后的转换语音;
S4.将解码后的转换语音输入直方图匹配算法中进行处理,得到最终转换后的语音。
进一步的,所述步骤S1中编码器包括内容编码器和说话人编码器。
进一步的,所述步骤S1具体为将源语音输入至内容编码器中进行编码处理,得到语音内容信息;将目标语音输入至说话人编码器中进行编码处理,得到说话人信息。
进一步的,所述步骤S2中进行均值和方差的对齐处理是对输入的语音内容信息进行均值和方差的对齐处理,以匹配说话人信息的均值和方差。
进一步的,所述步骤S2中对输入的语音内容信息进行均值和方差的对齐处理,表示为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010417945.9/2.html,转载请声明来源钻瓜专利网。





