[发明专利]一种基于综合加权算法的口型动画合成方法有效

申请号：	201410712164.7	申请日：	2014-11-27
公开（公告）号：	CN104361620B	公开（公告）日：	2017-07-28
发明（设计）人：	韩慧健;梁秀霞;贾可亮;张锐;刘峥;其他发明人请求不公开姓名	申请（专利权）人：	韩慧健
主分类号：	G06T13/40	分类号：	G06T13/40;G10L13/02
代理公司：	北京元本知识产权代理事务所11308	代理人：	秦力军
地址：	250014 山***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于综合加权算法口型动画合成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于综合加权算法的口型动画合成方法，其特征在于，依次包括以下步骤：

步骤1：输入汉语文本，针对输入的汉语文本进行分析，将汉字拆分为不同的汉语可视化音素，并将这些因素发送到语音合成系统合成为基本的可视化音素流；

步骤2：基于MPEG-4标准建立具有真实感的参数人脸模型，使用可视化音素动画帧参数驱动模型的形变，实现人脸口型动画；

步骤3：从输入汉语文本中获得与输入汉语文本同步的输入背景噪声，对输入背景噪声进行分析，进行输入背景噪声平滑处理，得到初始输入背景噪声；

步骤4：从汉字拆分为不同的汉语可视化音素中分别提取音素拆分后的音素输入背景噪声，对音素输入背景噪声进行分析，进行音素输入背景噪声平滑处理，得到初始音素输入背景噪声；

步骤5：利用得到的初始音素输入背景噪声，对得到的初始输入背景噪声进行校正，得到校正后的输入背景噪声；

步骤6：基于综合加权算法，获得声韵时间控制比例，添加声韵权重值因子，重新计算单音素口型动画的时间，控制口型动画的合成，将合成的汉语语音与人脸口型动画同步；

步骤7：根据动画场景添加背景图像，与合成的汉语语音与人脸口型动画同步；

步骤8：基于综合加权算法，获得噪声时间控制比例，添加噪声权重值因子，计算校正后的输入背景噪声的噪声同步时间；

步骤9：根据动画合成的需求，选择控制添加校正后的输入背景噪声，与合成汉语语音、人脸口型动画和背景图像的合成动画进行同步，实现逼真的人脸口型动画。

2.如权利要求1所述的一种基于综合加权算法的口型动画合成方法，其特征在于：所述针对输入的汉语文本进行分析，将汉字拆分为不同的汉语可视化音素是将汉字按照标准汉语拼音中声母和韵母的划分，完成口型拼音声部和口型拼音韵部的定义，将汉字的标准拼音转换成口型声部和口型韵部符号组成的口型拼音。

3.如权利要求1所述的一种基于综合加权算法的口型动画合成方法，其特征在于：所述基于综合加权算法，获得的声韵时间控制比例，添加声韵权重值因子，重新计算单音素口型动画的时间，控制口型动画的合成包括以下步骤：

语音段a、b内各时间帧的特征矢量分别为X_i，Y_i，其中1≤i≤N_a，1≤j≤N_b，X_i与Y_i的欧氏距离为d_ij，那么a、b段的段间距离为：

$<mrow><msub><mi>D</mi><mrow><mi>a</mi><mo>,</mo><mi>b</mi></mrow></msub><mo>=</mo><mfrac><mn>1</mn><mrow><msub><mi>N</mi><mi>a</mi></msub><msub><mi>N</mi><mi>b</mi></msub></mrow></mfrac><munderover><mo>Σ</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>a</mi></msub></munderover><munderover><mo>Σ</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><msub><mi>N</mi><mi>b</mi></msub></munderover><msub><mi>d</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub></mrow>$

D_a,b为a、b间所有特征矢量距离的平均值，反映了a、b之间的总体差异，待分割的口型动画被划分为T帧,分别标记为1，……，T，以第t帧为分界，前后各取m帧构成两个子语音段，即i∈[t-m+1,……,t]与j∈[t+1,……,t+m]，得到这两个子语音段的段间距离为

$<mrow><msub><mi>D</mi><mi>t</mi></msub><mo>=</mo><mfrac><mn>1</mn><msup><mi>m</mi><mn>2</mn></msup></mfrac><munderover><mo>Σ</mo><mrow><mi>i</mi><mo>=</mo><mi>t</mi><mo>-</mo><mi>m</mi><mo>+</mo><mn>1</mn></mrow><mi>t</mi></munderover><munderover><mo>Σ</mo><mrow><mi>j</mi><mo>=</mo><mi>t</mi><mo>+</mo><mn>1</mn></mrow><mrow><mi>t</mi><mo>+</mo><mi>m</mi></mrow></munderover><msub><mi>d</mi><mrow><mi>i</mi><mi>j</mi></mrow></msub></mrow>$

计算获得的声韵时间控制比例，添加声韵权重值w_s、w_y因子，重新计算单音素口型动画的时间，控制口型动画的合成：

$<mrow><msub><mi>t</mi><mi>s</mi></msub><mo>=</mo><msub><mi>w</mi><mi>s</mi></msub><msub><mover><mi>t</mi><mo>&OverBar;</mo></mover><mi>p</mi></msub><mo>;</mo><msub><mi>t</mi><mi>y</mi></msub><mo>=</mo><msub><mi>w</mi><mi>y</mi></msub><msub><mover><mi>t</mi><mo>&OverBar;</mo></mover><mi>p</mi></msub><mo>;</mo></mrow>$

其中w_s+w_y＝1；

采取M组数据每组数据N个样点，并对其进行平均化处理，经过特征系统的评估，将取方差最小时时间数据的平均时间作为进行口型动画合成的单汉字口型动画的标准时间。

4.如权利要求3所述的一种基于综合加权算法的口型动画合成方法，其特征在于：所述基于综合加权算法，获得的声韵时间控制比例，添加声韵权重值因子，重新计算单音素口型动画的时间，控制口型动画的合成还包括以下步骤：考虑汉语标点符号对连续口型变化的影响，在合成连续动画时考虑在句内或句末出现的停顿时间较长的7种点号，即句号、叹号、问号、顿号、逗号、分号、冒号，根据这7种标号在句中或者句末停顿时间的长短赋以不同的权值w_bi，

$<mrow><msubsup><mi>t</mi><mi>s</mi><mo>′</mo></msubsup><mo>=</mo><msub><mi>w</mi><mi>s</mi></msub><msub><mover><mi>t</mi><mo>&OverBar;</mo></mover><mi>p</mi></msub><msub><mi>w</mi><mrow><mi>b</mi><mi>i</mi></mrow></msub><mo>;</mo><msubsup><mi>t</mi><mi>y</mi><mo>′</mo></msubsup><mo>=</mo><msub><mi>w</mi><mi>y</mi></msub><msub><mover><mi>t</mi><mo>&OverBar;</mo></mover><mi>p</mi></msub><msub><mi>w</mi><mrow><mi>b</mi><mi>i</mi></mrow></msub><mo>;</mo></mrow>$

w_bi代表标号中第i个标号的权重值，通过改变一定限度内的w_bi标号权重值生成类似的训练集的基本口型，用到连续动画合成通道上。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于韩慧健，未经韩慧健许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410712164.7/1.html，转载请声明来源钻瓜专利网。

上一篇：一种计算机三维模型中全局光照的渲染方法
下一篇：一种基于稀疏表示的无参考彩色图像质量评价方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06T 一般的图像数据处理或产生
G06T13-00 动画制作
G06T13-20 .3D［三维］动画
G06T13-80 .2D［二维］动画，如使用精灵sprites
G06T13-40 ..关于角色的，例如：人类、动物或虚幻人物
G06T13-60 ..关于自然景观的，例如：雨、雪、水或植物

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于综合加权算法的口型动画合成方法有效

专利文献下载