[发明专利]基于隐马尔科夫模型的统计语音合成方法及装置有效

专利信息
申请号: 201510272044.4 申请日: 2015-05-25
公开(公告)号: CN105047192B 公开(公告)日: 2018-08-17
发明(设计)人: 俞凯;王向然;陈博;徐佳琛 申请(专利权)人: 上海交通大学;苏州思必驰信息科技有限公司
主分类号: G10L13/027 分类号: G10L13/027;G06F21/36;G06F21/32
代理公司: 上海交达专利事务所 31201 代理人: 王毓理;王锡麟
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 隐马尔科夫 模型 统计 语音 合成 方法 装置
【权利要求书】:

1.一种基于隐马尔科夫模型的统计语音合成装置,其特征在于,包括:自然语言问题生成模块、图片生成模块以及语音合成模块模块,其中:自然语言问题生成模块与图片生成模块、语音合成模块相连,并输出图片生成规则到图片生成模块,输出自然语言问题字符串到语音合成模块,输出问题答案;图片生成模块与自然语言问题生成模块相连并接收图片生成规则,输出最终生成的图片;语音合成模块与自然语言问题生成模块相连并接收自然语言问题字符串,输出最终合成的语音;

所述的语音合成模块包括:数据持久单元、参数调整单元、自适应合成单元、统计合成单元,其中:数据持久单元与参数调整单元和自适应合成单元相连,向参数调整单元发送预先存储的参数动态调整范围,随机选择事先训练的声音模型、决策树已经自适应数据集并向自适应合成单元发送;参数调整单元与数据持久单元、统计合成单元相连,从数据持久单元接收参数动态调整范围,生成动态调整的参数并向统计合成单元发送;自适应合成单元接收参数调整单元发送的声音模型、决策树以及自适应数据集,对该模型做自适应训练并输出训练得到的声音模型和决策树到统计合成单元;统计合成单元与数据持久单元、参数调整单元、自适应合成单元相连,接收参数调整单元传送的参数并对自适应合成单元传送过来的时长模型进行调整,最后接收自然语言问题生成模块传送的问题字符串,生成问题语音并传送给用户端;

所述装置通过生成关联多模态的自然语言问题,根据自然语言问题生成相应图片并加入干扰元素,根据问题文本,使用基于HMM的语音合成方法的多模态验证码合成语音并加入噪声,使得破解验证码的难度由单模态的验证码破解概率提升到几个单模态的验证码破解概率的叠加,在不降低用户体验的基础上提高了验证码的人机区分度。

2.根据权利要求1所述的装置,其特征是,所述的合成方法,具体包括:

步骤1、自然语言问题生成,具体包括以下步骤:

1.1)建立自然语言问题规则数据库,每条数据库记录包括一个自然语言问题生成规则和对应的图片生成规则,这两条对应的规则的输入参数相同;

1.2)从自然语言问题规则数据库中随机选取一条记录,随机产生该条记录中的规则所需的参数,并保存该数据库记录和参数;

1.3)根据该条记录中的规则和上一步中随机生成的参数,生成一条字符串,即所需的自然语言问题;

1.4)根据该条记录中的规则和上一步中随机生成的参数,计算并生成问题的答案;

步骤2、图片生成,具体包括以下步骤:

2.1)提取步骤1.2中的所保存的数据库记录;

2.2)根据该条数据库记录中的的自然语言问题生成规则所对应的图片生成规则,以及随机产生的输入参数,生成一张带有步骤1.3中生成的自然语言问题的答案的原始图片;

2.3)将上一步生成原始图片,通过一系列操作如几何变换、加入干扰线条和像素点、随机叠加干扰图片等方法,生成最后呈现给用户的图片;

步骤3、通过基于隐马尔科夫模型的统计语音合成方法合成语音,具体包括以下步骤:

3.1)建立已经训练好的基础语音模型数据库,每一条数据库记录包含一个基础的语音数据的模型和决策树,每一个语音数据的模型和决策树由多种说话人、多种语调、多种说话风格的声音数据集经过训练得到;

3.2)随机选择一条语音数据库中的记录,取出记录中的模型和决策树,通过动态设置参数调整时长模型,对声学模型进行自适应训练得到新的声学模型;

3.3)通过调整后的模型和决策树,生成新的二进制语音合成文件;

3.4)取得步骤1.3中生成的自然语言问题字符串,通过上一步生成的二进制语音合成文件,生成原始的合成语音;

3.5)给上一步生成的原始合成语音加入加性噪声,即原始音频和噪声音频直接叠加,生成最终的音频。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学;苏州思必驰信息科技有限公司,未经上海交通大学;苏州思必驰信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510272044.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top