[发明专利]基于DenseNet STARGAN的多对多说话人转换方法在审
申请号: | 202010179723.8 | 申请日: | 2020-03-16 |
公开(公告)号: | CN111833855A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 李燕萍;袁昌龙;徐玲俐 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G10L15/08 | 分类号: | G10L15/08;G10L15/16;G10L15/18;G10L15/06 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 刘文闻 |
地址: | 210003 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于DenseNet STARGAN的多对多说话人转换方法,采用STARGAN与DenseNet相结合来实现语音转换系统,并将GELU激活函数引入STARGAN中。一方面利用DenseNet来解决训练过程中网络退化问题,有助于训练过程中梯度的反向传播,提升深层网络训练效率,另一方面,使用GELU激活函数替换掉常规使用的ReLU激活函数,具有更强的非线性表示能力,有效解决了ReLU在负区间处于失活状态的缺点,进一步缓解了训练过程中网络退化的问题,增强了STARGAN模型的表征能力,很好地改善了转换后语音的个性相似度和语音质量,实现了一种高质量的多说话人到多说话人的语音转换方法,在跨语种语音转换、电影配音、语音翻译等领域有良好的应用前景。 | ||
搜索关键词: | 基于 densenet stargan 说话 转换 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202010179723.8/,转载请声明来源钻瓜专利网。
- 上一篇:牙体检查床云端辅助系统
- 下一篇:半导体存储器模块