[发明专利]一种基于声道和韵律特征的情感语音转换方法在审
申请号: | 201711454427.9 | 申请日: | 2017-12-28 |
公开(公告)号: | CN108447470A | 公开(公告)日: | 2018-08-24 |
发明(设计)人: | 陈明义;杨婧 | 申请(专利权)人: | 中南大学 |
主分类号: | G10L13/10 | 分类号: | G10L13/10;G10L13/033;G10L19/07;G10L21/007;G10L25/30;G10L25/45 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 情感语音 韵律特征 声道 转换 中性语音 预处理 模型输出参数 参数输入 合成目标 交流方式 匹配模型 人机交互 语音合成 语音转换 转换模型 语义 对中性 语音 局限 对话 | ||
本发明提供一种基于声道和韵律特征转换的情感语音转换的方法,主要解决未来人与机器的交流方式问题。包括:首先进行情感语音训练,对中性与其它情感语音进行预处理,然后提取其声道和韵律特征参数,建立匹配模型;其次再进行情感语音转换,将中性语音的声道和韵律特征参数输入到转换模型中,并将模型输出参数用到语音合成中,来合成目标情感语音。本发明采用的方法不再局限于中性语音的对话,在相同语义和说话人信息的情况下,能够实现中性向不同情感之间的语音转换,获得具有情感表现力的语音,有利于未来更好的人机交互。
技术领域
本发明属于音频信号处理领域,涉及一种基于声道和韵律特征的情感语 音转换方法。
背景技术
随着人工智能技术和机器人的发展,人类的生活日益丰富,听演唱会,看 电影和电视剧,玩直播、手机游戏和虚拟现实逐渐成为大众喜欢的娱乐方式,人 们为了得到更好的听觉体验,对语音的要求也越来越高。现今人与计算机最常见 的交流方式就是使用中性语言,而未来人与机器人的对话不再局限于中性语音 的对话。在情感计算和智能交互领域中,为了赋予计算机观察、理解和表达情感 的能力,情感语音转换将成为一项重要的研究。
情感语音转换属于语音转换的一种,语音转换是指改变源说话人的语音 个性化信息,从而带上目标说话人的语音个性化信息,其中个性化信息很广泛, 包括性别,情感,年龄等信息。通过对语音转换的研究,可以进一步探究人类语 音的发音机制,更好地掌握语音的参数特征,让人们可以通过操控这些关键的参 数信息而改变语音信息,来达到自己的目的。语音转换的意义不仅仅局限于转换 本身,还和语音分析、识别、编码、增强、隐藏等技术相关。首先,语音转换的 研究离不开这些相关技术的研究理论和成果;其次,语音转换技术的研究推动了 这些相关技术领域的发展。
语音转换最常见的做法是基于语音特征的统计分布来实现声音转换,有 的采用高斯混合模型(GMM)描述源与目标特征参数的概率分布,将利用给定源特 征参数预测目标特征参数的问题变为求解一个线性回归函数的问题;有的采用 码本加权叠加的方法来得到目标说话人的参数特征;有的采用声道长度归一化 技术调整语音频谱,从而进行语音转换;还有基于固定长度帧的非基音同步的方 法和信号相关的方法,激励源信号采用脉冲信号、三角波信号、噪音源等信号, 通过线性频谱搬移和分析合成法进行男女之间的语音转换。
发明内容
本发明提出了一种基于声道和韵律特征的情感语音转换方案,可以解决 医疗领域中的效率安全问题,例如应用在智能机器人心理医生上,不仅避免了人 类心理医生免受暴力或精神异常患者的伤害,还缩短了患者诊断时间,提高了工 作效率;在交通安全方面,本发明能降低交通事故发生概率,大大减少交通事故 死亡率。情感语音转换意味着在相同语音的情况下,将语音从一种情感换成另一 种情感。
为了达到上述目的,本发明的方法包括为:
S1:情感语音训练阶段,先对中性和其他情感语音进行预处理,然后提取 其声道和韵律特征参数,建立转换模型。
S2:情感语音转换阶段,将中性语音的声道和韵律特征参数输入转换模型 中,将模型输出参数进行语音合成,合成目标情感语音。
进一步,所述步骤S1中,所述的预处理是指设置一系列参数,对语音进 行分帧加窗预处理。参数包括:帧长、帧移、窗函数,LSP系数的阶数。
其中,所述帧长,是指经过数字化的音频信号实际上是一个时变信号,为 了能对音频信号进行分析,可以假设音频信号在几十毫秒的时间内是平稳的。 为了得到短时音频信号,将语音信号分为一段一段地来分析其特征,其中每一段 称为“一帧”,分帧是连续的,帧长一般取10~30毫秒,此时方案将分帧定为 20毫秒。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711454427.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型的变电站用吸声复合板
- 下一篇:语音识别方法及语音识别装置