[发明专利]大规模生理发音数据处理中声道的形态规范方法无效
申请号: | 201210196547.4 | 申请日: | 2012-06-14 |
公开(公告)号: | CN102799759A | 公开(公告)日: | 2012-11-28 |
发明(设计)人: | 魏建国;陈龙;党建武;宋婵;王宇光 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种大规模生理发音数据处理中声道的形态规范方法,该方法包括步骤:首先是模板的建立,然后是标志点的标定,最后是根据模板和说话人模型中标志点的对应关系确定各自薄板样条函数的参数。与现有技术相比,本发明和传统的利用直线化的标准方法相比,通过对不同发音人的声道进行形态上的规范,来实现生理发音数据的规范的同时,却还能保持生理发音的运动特性和空间位置关系。 | ||
搜索关键词: | 大规模 生理 发音 数据处理 声道 形态 规范 方法 | ||
【主权项】:
1.一种大规模生理发音数据处理中声道的形态规范方法,其特征在于,该方法包括以下步骤:步骤一,从生理发音数据库中获得多组上颚和舌头表面轮廓线条数据,依据该数据得到生理发音过程中声道的平均形状建立本方法的多组模板;步骤二、利用网格系统对前一步骤的多组模板的声道形状中的标志点进行标注,具体做法:首先,依据生理发音数据库中所有元音生理发音的数据计算舌头表面轮廓曲线的平均形状,然后再由数据库中所有舌表面的数据计算出舌头表面中心点的平均位置;依据舌头表面轮廓曲线的平均形状和舌表面中心点平均位置确定网格系统;将得到的整个网格系统分割成十个同样大小的扇区,使十个扇区覆盖整个生理发音过程中声道运动的空间,并且每个扇区的边分别和上颚曲线、中位曲线、舌表面曲线以及舌表面之下曲线相交,从而到44个相交的点,将这44个点就作为声道的标注点;步骤三、利用上述标注点与生理发音数据库中原始点之间一一对应关系来确定薄板样条函数参数,实现生理发音数据处理中声道的形态规范,具体算法包括:假设声道二维坐标系中有n个坐标点,薄板样条的曲翘可由2(n+3)个参数描述,这些参数由6个全局线性参数以及n个标志点的共2n个非线性参数组成,其中一半是x轴方向的参数描述,另一半是y轴方向的参数描述。这2(n+3)个参数可由[7]中提到的线性系统确定。假设
表示平面上n个标志点,本实验中是44个标志点的情况。这些标志点的坐标带入薄板样条函数求得的对应的函数值是![]()
可见薄板样条差值函数f(x,y)表示的是
的一个映射关系。薄板样条差值函数定义如下:f ( x , y ) = a 1 + a 2 x + a 3 y + Σ i = 1 n w i r i 2 ln r i 2 - - - ( 1 ) ]]> 上述的等式(1),a1+a2x+a3y是线性变换,
是非线性变换;其中r含义如下
代表每个发音者空间中将要进行变换的点,相对于各个标志点的距离平方,x和y分别代表薄板样条f(x,y)中即插入薄板样条函数将要进行变换的点的坐标。等式(1)是以各个标志点坐标
为负载中心在无限空间范围内薄板形变的等式。薄板在以
为负载中心的情况下的权值为wi。薄板的样条插值函数由两部分构成;一部分由前三个元素描述的线性变化,剩下的部分是描述样条曲翘的非线性变化。通过使函数f差值函数的弯曲能量Ef能达到最小的限定条件,以及将标志点的坐标一一对应关系来确定a1,a2,a3和wi的值,从而确定薄板样条函数。其中Ef定义如下:
式(2)代表弯曲能量,可以看出当代表弯曲能量的Ef最小时,f(x,y)进行的变换将达到最低的扭曲程度,接近于薄板平面上的变换。以下是三个约束条件:Σ i = 1 n w i = 0 - - - ( 3 ) ]]>Σ i = 1 n x ^ i w i = 0 - - - ( 4 ) ]]>Σ i = 1 n y ^ i w i = 0 - - - ( 5 ) ]]> 约束条件(3)表明所有应用在薄板上的负载的和应该是零。这要求薄板在强制负载的情况下保持静止而不是运动。约束(4)和(5)提出的要求是当在薄板强加负载且不旋转的情况下x轴和y轴各自方向的运动是零。TPS参数向量a包含a1,a2和a3三个分量,向量w包含若干个wi分量,这两个向量可以通过下面的线性方程计算得到:A P P T 0 w a = v 0 - - - ( 6 ) ]]> 其中
其中n等于标志点的个数,j等于需要变换的原始数据坐标点的个数,由于每个需要变换的坐标点都要以不同的标志点为中心求解负载,所以A中是n×m个rij。矩阵P的第i行是一维三元向量
O是3×3的零矩阵。在等式(6)的最右边的0是一维三元的零向量。w,a和v是分别由wi,a1,a2,a3和vi分量组成的一维向量。等式最左边的(n+3)×(n+3)矩阵接下来用K表示。参考给定的每个实验者EMMA数据的标志点(x′,y′)与模板中定义的标志点
对应关系,的重点是EMMA数据的坐标
到模板坐标系中对应坐标
的映射。所以关心的是由多对控制点定义的薄板样条函数经过变形得到的2D点。为此,用TPS函数分别对数据的x坐标和y坐标进行映射。从等式6可以推导出薄板样条
到
映射的曲翘变换,可以通过下述公式恢复:w x w y a x a y = K - 1 x ^ ′ y ^ ′ 0 0 - - - ( 7 ) ]]> 其中
和
是分别由从
和
分量组成的一维向量。wx和ax是x轴的参数,wy和ay是y轴的参数。点(xj,yj)到坐标
的转换由以下公式求得:x ′ y ′ = B Q w x w y a x a y - - - ( 8 ) ]]> 其中B ji = ( ( x j - x ^ i ) 2 + ( y j - y ^ i ) 2 ) ln ( ( x j - x ^ i ) 2 + ( y j - y ^ i ) 2 ) , i = 1 , . . . , n , j = 1 , . . . , m . Q ]]> 矩阵的第j排为向量(1,xj,yj),结果中向量x′和y′的第j排是将x和y带入带入公式之后得到的
和
向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210196547.4/,转载请声明来源钻瓜专利网。
- 上一篇:可调式节水喷嘴
- 下一篇:一种治疗便秘型闭合性骨折的中药洗剂制备方法
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用