[发明专利]生成语音动画的方法和装置有效

申请号：	201610889079.7	申请日：	2016-10-11
公开（公告）号：	CN106653054B	公开（公告）日：	2020-02-14
发明（设计）人：	王夏鸣;赵志翔	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G10L21/12	分类号：	G10L21/12
代理公司：	11201 北京清亦华知识产权代理事务所(普通合伙)	代理人：	张大威
地址：	230088 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	生成语音动画方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提出一种生成语音动画的方法和装置，该生成语音动画的方法包括：获取当前语音信号的音量值；根据所述音量值，在组成待生成的语音动画波形的位置点中确定波峰位置点，以及确定波峰位置点的波峰振幅值；根据所述波峰位置点和所述波峰振幅值，生成语音动画波形。该方法能够生成更准确的仿声音频谱的语音动画，为用户带来更逼真的语音反馈体验。

技术领域

本申请涉及语音信号处理等技术领域，尤其涉及一种生成语音动画的方法和装置。

背景技术

在主流智能手机系统上，如iOS、Android，第三方软件有权限访问手机麦克风，并利用系统层级的音频录制接口获取麦克风录制的声音。具有语音录制功能的应用软件在与用户交互时，可以通过语音动画的形式向用户实时反馈录音状态，以告知用户目前的状态是在录音。

相关技术中的语音动画虽然可以展示出类似声音频谱的涟漪效果，但是通过对相关技术中的语音动画的分析，其不能准确地反映出声音信号的真实特征，在仿真效果等方面都存在一定问题。

发明内容

本申请旨在至少在一定程度上解决相关技术中的技术问题之一。

为此，本申请的一个目的在于提出一种生成语音动画的方法，该方法能够生成更准确的仿声音频谱的语音动画，为用户带来更逼真的语音反馈体验。

本申请的另一个目的在于提出一种生成语音动画的装置。

为达到上述目的，本申请第一方面实施例提出的生成语音动画的方法，包括：获取当前语音信号的音量值；根据所述音量值，在组成待生成的语音动画波形的位置点中确定波峰位置点，以及确定波峰位置点的波峰振幅值；根据所述波峰位置点和所述波峰振幅值，生成语音动画波形。

本申请第一方面实施例提出的生成语音动画的方法，通过获取音量值并根据音量值确定波峰位置点和波峰振幅值，可以更真实地反映声音具有的频谱特征，从而生成更准确的仿声音频谱的语音动画，为用户带来更逼真的语音反馈体验。

为达到上述目的，本申请第二方面实施例提出的生成语音动画的装置，包括：音量获取模块，用于获取当前语音信号的音量值；波峰确定模块，用于根据所述音量值，在组成待生成的语音动画波形的位置点中确定波峰位置点，以及确定波峰位置点的波峰振幅值；波形生成模块，用于根据所述波峰位置点和所述波峰振幅值，生成语音动画波形。

本申请第二方面实施例提出的生成语音动画的装置，通过获取音量值并根据音量值确定波峰位置点和波峰振幅值，可以更真实地反映声音具有的频谱特征，从而生成更准确的仿声音频谱的语音动画，为用户带来更逼真的语音反馈体验。

本申请附加的方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本申请的实践了解到。

附图说明

本申请上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中：

图1是本申请一个实施例提出的生成语音动画的方法的流程示意图；

图2是本申请实施例中组成待生成的语音动画波形的位置点的示意图；

图3是本申请另一个实施例提出的生成语音动画的方法的流程示意图；

图4是本申请实施例中候选波峰位置点的示意图；

图5是本申请实施例中最终采用的波峰位置点的示意图；

图6是本申请实施例中波峰振幅值的初始值的示意图；

图7是本申请实施例中波峰振幅值的最终值的示意图；

图8是本申请实施例中生成的语音动画波形的示意图；