[发明专利]一种ARM侧离线语音合成的方法、装置及存储介质有效
申请号: | 202110599311.4 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113362803B | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 张毅;胡奎;姜黎 | 申请(专利权)人: | 杭州芯声智能科技有限公司 |
主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L25/18;G10L25/30 |
代理公司: | 成都知都云专利代理事务所(普通合伙) 51306 | 代理人: | 赵正寅 |
地址: | 310000 浙江省杭州市杭州经济技术*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供的一种ARM侧离线语音合成的方法、装置及存储介质,涉及语音合成技术领域。本发明通过对ARM侧设备部署音素序列生成器、音素—时间标签序列生成器、声学特征生成器和声码器来进行离线语音合成,通过对ARM侧设备部署的各生成器进行进行Python toc/c++porting重编译和对Tensorflow平台的32位float型模型浮点参数进行量化压缩,使ARM侧设备能够快速进行离线语音合成且达到节省ARM侧设备所需部署空间、降低ARM侧设备运算要求的目的;通过通过将MelGAN模型作为神经网络声码模型,达到了提升训练速率,在没有额外的蒸馏和感知损失的引入下仍能产生高质量的语音合成模型;将Fastspeech 2模型神经网络声学特征生成模型能达到升模型训练速率和增加了数据的丰富度避免过多的信息损失的目的。 | ||
搜索关键词: | 一种 arm 离线 语音 合成 方法 装置 存储 介质 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州芯声智能科技有限公司,未经杭州芯声智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110599311.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种老年人室内独自发生意外的及时救援系统
- 下一篇:一种便携式接线盒