[发明专利]一种基于综合加权算法的口型动画合成方法有效

专利信息
申请号: 201410712164.7 申请日: 2014-11-27
公开(公告)号: CN104361620B 公开(公告)日: 2017-07-28
发明(设计)人: 韩慧健;梁秀霞;贾可亮;张锐;刘峥;其他发明人请求不公开姓名 申请(专利权)人: 韩慧健
主分类号: G06T13/40 分类号: G06T13/40;G10L13/02
代理公司: 北京元本知识产权代理事务所11308 代理人: 秦力军
地址: 250014 山*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 综合 加权 算法 口型 动画 合成 方法
【权利要求书】:

1.一种基于综合加权算法的口型动画合成方法,其特征在于,依次包括以下步骤:

步骤1:输入汉语文本,针对输入的汉语文本进行分析,将汉字拆分为不同的汉语可视化音素,并将这些因素发送到语音合成系统合成为基本的可视化音素流;

步骤2:基于MPEG-4标准建立具有真实感的参数人脸模型,使用可视化音素动画帧参数驱动模型的形变,实现人脸口型动画;

步骤3:从输入汉语文本中获得与输入汉语文本同步的输入背景噪声,对输入背景噪声进行分析,进行输入背景噪声平滑处理,得到初始输入背景噪声;

步骤4:从汉字拆分为不同的汉语可视化音素中分别提取音素拆分后的音素输入背景噪声,对音素输入背景噪声进行分析,进行音素输入背景噪声平滑处理,得到初始音素输入背景噪声;

步骤5:利用得到的初始音素输入背景噪声,对得到的初始输入背景噪声进行校正,得到校正后的输入背景噪声;

步骤6:基于综合加权算法,获得声韵时间控制比例,添加声韵权重值因子,重新计算单音素口型动画的时间,控制口型动画的合成,将合成的汉语语音与人脸口型动画同步;

步骤7:根据动画场景添加背景图像,与合成的汉语语音与人脸口型动画同步;

步骤8:基于综合加权算法,获得噪声时间控制比例,添加噪声权重值因子,计算校正后的输入背景噪声的噪声同步时间;

步骤9:根据动画合成的需求,选择控制添加校正后的输入背景噪声,与合成汉语语音、人脸口型动画和背景图像的合成动画进行同步,实现逼真的人脸口型动画。

2.如权利要求1所述的一种基于综合加权算法的口型动画合成方法,其特征在于:所述针对输入的汉语文本进行分析,将汉字拆分为不同的汉语可视化音素是将汉字按照标准汉语拼音中声母和韵母的划分,完成口型拼音声部和口型拼音韵部的定义,将汉字的标准拼音转换成口型声部和口型韵部符号组成的口型拼音。

3.如权利要求1所述的一种基于综合加权算法的口型动画合成方法,其特征在于:所述基于综合加权算法,获得的声韵时间控制比例,添加声韵权重值因子,重新计算单音素口型动画的时间,控制口型动画的合成包括以下步骤:

语音段a、b内各时间帧的特征矢量分别为Xi,Yi,其中1≤i≤Na,1≤j≤Nb,Xi与Yi的欧氏距离为dij,那么a、b段的段间距离为:

<mrow><msub><mi>D</mi><mrow><mi>a</mi><mo>,</mo><mi>b</mi></mrow></msub><mo>=</mo><mfrac><mn>1</mn><mrow><msub><mi>N</mi><mi>a</mi></msub><msub><mi>N</mi><mi>b</mi></msub></mrow></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>a</mi></msub></munderover><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>b</mi></msub></munderover><msub><mi>d</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub></mrow>

Da,b为a、b间所有特征矢量距离的平均值,反映了a、b之间的总体差异,待分割的口型动画被划分为T帧,分别标记为1,……,T,以第t帧为分界,前后各取m帧构成两个子语音段,即i∈[t-m+1,……,t]与j∈[t+1,……,t+m],得到这两个子语音段的段间距离为

<mrow><msub><mi>D</mi><mi>t</mi></msub><mo>=</mo><mfrac><mn>1</mn><msup><mi>m</mi><mn>2</mn></msup></mfrac><munderover><mo>&Sigma;</mo><mrow><mi>i</mi><mo>=</mo><mi>t</mi><mo>-</mo><mi>m</mi><mo>+</mo><mn>1</mn></mrow><mi>t</mi></munderover><munderover><mo>&Sigma;</mo><mrow><mi>j</mi><mo>=</mo><mi>t</mi><mo>+</mo><mn>1</mn></mrow><mrow><mi>t</mi><mo>+</mo><mi>m</mi></mrow></munderover><msub><mi>d</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub></mrow>

计算获得的声韵时间控制比例,添加声韵权重值ws、wy因子,重新计算单音素口型动画的时间,控制口型动画的合成:

<mrow><msub><mi>t</mi><mi>s</mi></msub><mo>=</mo><msub><mi>w</mi><mi>s</mi></msub><msub><mover><mi>t</mi><mo>&OverBar;</mo></mover><mi>p</mi></msub><mo>;</mo><msub><mi>t</mi><mi>y</mi></msub><mo>=</mo><msub><mi>w</mi><mi>y</mi></msub><msub><mover><mi>t</mi><mo>&OverBar;</mo></mover><mi>p</mi></msub><mo>;</mo></mrow>

其中ws+wy=1;

采取M组数据每组数据N个样点,并对其进行平均化处理,经过特征系统的评估,将取方差最小时时间数据的平均时间作为进行口型动画合成的单汉字口型动画的标准时间。

4.如权利要求3所述的一种基于综合加权算法的口型动画合成方法,其特征在于:所述基于综合加权算法,获得的声韵时间控制比例,添加声韵权重值因子,重新计算单音素口型动画的时间,控制口型动画的合成还包括以下步骤:考虑汉语标点符号对连续口型变化的影响,在合成连续动画时考虑在句内或句末出现的停顿时间较长的7种点号,即句号、叹号、问号、顿号、逗号、分号、冒号,根据这7种标号在句中或者句末停顿时间的长短赋以不同的权值wbi

<mrow><msubsup><mi>t</mi><mi>s</mi><mo>&prime;</mo></msubsup><mo>=</mo><msub><mi>w</mi><mi>s</mi></msub><msub><mover><mi>t</mi><mo>&OverBar;</mo></mover><mi>p</mi></msub><msub><mi>w</mi><mrow><mi>b</mi><mi>i</mi></mrow></msub><mo>;</mo><msubsup><mi>t</mi><mi>y</mi><mo>&prime;</mo></msubsup><mo>=</mo><msub><mi>w</mi><mi>y</mi></msub><msub><mover><mi>t</mi><mo>&OverBar;</mo></mover><mi>p</mi></msub><msub><mi>w</mi><mrow><mi>b</mi><mi>i</mi></mrow></msub><mo>;</mo></mrow>

wbi代表标号中第i个标号的权重值,通过改变一定限度内的wbi标号权重值生成类似的训练集的基本口型,用到连续动画合成通道上。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于韩慧健,未经韩慧健许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410712164.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top