[发明专利]基于聚类和多任务学习的化学机械研磨时间设定方法有效
| 申请号: | 201410805040.3 | 申请日: | 2014-12-23 |
| 公开(公告)号: | CN104598720B | 公开(公告)日: | 2018-04-10 |
| 发明(设计)人: | 刘民;段运强;董明宇;郝井华 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06F19/00 | 分类号: | G06F19/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 任务 学习 化学 机械 研磨 时间 设定 方法 | ||
1.基于聚类和多任务学习的化学机械研磨时间设定方法,其特征在于,所述方法是在计算机上依次按以下步骤实现的:
步骤(1):数据整理
本方法中所建立的优化设定模型以4项工艺指标及产品状态组成模型输入行向量x,其中包括:研磨材料去除速率、来片厚度、抽测先行片出片厚度和lot抽测出片厚度,以化学机械研磨时间为模型输出y;假设模型输入输出之间的关系满足下式:
y=xw+δ
其中列向量w表示待确定的模型参数,δ为噪声;
假设有m个产品品种;第i个产品品种的Ni个样本输入记为矩阵其第j行xi(j)表示第i个产品品种的第j个样本的输入向量,d为模型输入变量个数,d=4;第i个产品品种的Ni个样本输出记为列向量其第j个元素表示第i个产品品种的第j个样本的输出,即化学机械研磨时间;为便于后续表示,用X表示由输入矩阵[X1,X2,...,Xm-1,Xm]纵向排列所构成的矩阵;同样用Y表示由输出向量[y1,y2,...,ym-1,ym]纵向排列构成的列向量;X和Y均有行,N表示所有的样本总数;列向量表示每个样本所属品种的标号,取值范围为{1,2,...,m-1,m};
步骤(2):计算不同品种的相似度矩阵
采用极大似然估计方法计算每个品种的概率分布函数,在多维高斯分布假设下每个品种相对应的均值向量和方差矩阵的估计值为:
其中矩阵行向量zi(j)表示矩阵Zi的第j行,包含4个输入变量和1个输出变量;
采用巴氏距离比较不同品种之间的差异度,即比较不同品种多维高斯分布的差异度;巴氏距离的定义为:
在多维高斯分布的假设下,巴氏距离有解析表达式:两个多维高斯分布G1~N(μ1,∑1)和G2~N(μ2,∑2)的巴氏距离计算式:
其中|A|表示矩阵A的行列式;
因为后续仿射传播聚类方法所需输入为相似度,所以将差异度取负得到相似度;基于每个品种多元高斯分布均值向量和方差矩阵的估计值,计算得到相似度矩阵;
步骤(3):基于仿射传播的产品特征聚类
仿射传播聚类是一种基于信息累积的聚类方法,根据不同点的累积信息量确定聚类中心,利用相似度矩阵计算两种信息量;对点i和点k,所涉及的两种信息量r(i,k)和a(i,k)为:
迭代开始设置a(i,k)=0,然后根据上式迭代的更新r(i,k)和a(i,k)直到收敛;
仿射传播聚类中用偏好向量表示先验知识中每个任务成为聚类中心的可能性;在迭代中用偏好向量代替相似度矩阵中的对角线元素进而影响聚类中心的选择;因为样本数目较多的产品品种后续会得到更加准确的模型,更适合作为聚类中心,为了将样本数目这一先验用于聚类的过程中,采用如下方法设置仿射传播方法中的偏好向量;
设偏好向量的设定值为p=[p1,p2,...,pm-1,pm]:
其中L1表示希望样本数量大于L1的品种更倾向于成为聚类中心;设定a=0.005,b=2000,L=50;
步骤(4):基于共有参数提取的多任务学习
在聚类后得到的L个类别,对每个类别中的品种使用基于共有参数提取的多任务学习方法,其主要思想是将每个品种的模型参数分为两部分:共有参数和私有参数;共有参数是每个类别中所有品种的数据模型中相同的部分,用列向量表示;而私有参数是每个类别中每个品种的数据模型中不同的部分,用列向量表示;如果一个类别中有r个品种,则r个列向量v(i)可构成一个r列的矩阵V;基于共有参数提取的多任务学习方法可根据每个类别中的数据学习出这两部分的参数从而得到最终模型的参数,对第i个任务,最终的模型参数为:
wi=u+v(i)
在进行模型学习以前,需要先对数据进行归一化处理;然后设定模型的参数,包括λ1,λ2,λ3,随机初始化共有参数向量u和私有参数矩阵V;
迭代过程如下,其中X表示一类中r个品种的输入矩阵[X1,X2,...,Xr-1,Xr]纵向排列所构成的矩阵;同样用Y表示一类中r个品种的输出向量[y1,y2,...,yr-1,yr]纵向排列构成的列向量
对第k次迭代计算:
上式中:
根据pk,uk-1和Qk,Vk-1更新uk,Vk
uk=pk+αk(pk-pk-1)
Vk=Qk+αk(Qk-Qk-1)
其中α∈[0,1],可令α0=0;t0=1,
在迭代过程中,步长lk采用如下方法确定:
其中jk为使得下式成立的最小非负正整数:
对L个聚类所得的类别分别使用上述方法即可得到L个模型库,其包含了所有m个品种的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410805040.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:账户识别方法和系统
- 下一篇:一种网络模型校验方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





