[发明专利]基于聚类和多任务学习的化学机械研磨时间设定方法有效

专利信息
申请号: 201410805040.3 申请日: 2014-12-23
公开(公告)号: CN104598720B 公开(公告)日: 2018-04-10
发明(设计)人: 刘民;段运强;董明宇;郝井华 申请(专利权)人: 清华大学
主分类号: G06F19/00 分类号: G06F19/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 10008*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 任务 学习 化学 机械 研磨 时间 设定 方法
【权利要求书】:

1.基于聚类和多任务学习的化学机械研磨时间设定方法,其特征在于,所述方法是在计算机上依次按以下步骤实现的:

步骤(1):数据整理

本方法中所建立的优化设定模型以4项工艺指标及产品状态组成模型输入行向量x,其中包括:研磨材料去除速率、来片厚度、抽测先行片出片厚度和lot抽测出片厚度,以化学机械研磨时间为模型输出y;假设模型输入输出之间的关系满足下式:

y=xw+δ

其中列向量w表示待确定的模型参数,δ为噪声;

假设有m个产品品种;第i个产品品种的Ni个样本输入记为矩阵其第j行xi(j)表示第i个产品品种的第j个样本的输入向量,d为模型输入变量个数,d=4;第i个产品品种的Ni个样本输出记为列向量其第j个元素表示第i个产品品种的第j个样本的输出,即化学机械研磨时间;为便于后续表示,用X表示由输入矩阵[X1,X2,...,Xm-1,Xm]纵向排列所构成的矩阵;同样用Y表示由输出向量[y1,y2,...,ym-1,ym]纵向排列构成的列向量;X和Y均有行,N表示所有的样本总数;列向量表示每个样本所属品种的标号,取值范围为{1,2,...,m-1,m};

步骤(2):计算不同品种的相似度矩阵

采用极大似然估计方法计算每个品种的概率分布函数,在多维高斯分布假设下每个品种相对应的均值向量和方差矩阵的估计值为:

μ^i=1NiΣj=1Nizi(j),i={1,2,...,m-1,m}]]>

Σ^i=1Ni-1Σj=1Ni(zi(j)-μ^i)(zi(j)-μ^i)′,i={1,2,...,m-1,m}]]>

其中矩阵行向量zi(j)表示矩阵Zi的第j行,包含4个输入变量和1个输出变量;

采用巴氏距离比较不同品种之间的差异度,即比较不同品种多维高斯分布的差异度;巴氏距离的定义为:

dB(p(x),q(x))=-ln(∫p(x)q(x)dx)]]>

在多维高斯分布的假设下,巴氏距离有解析表达式:两个多维高斯分布G1~N(μ1,∑1)和G2~N(μ2,∑2)的巴氏距离计算式:

dB(G1,G2)=18(μ1-μ2)TΓ-1(μ1-μ2)+12ln(|Σ1|-12|Σ2|-12|Γ|)]]>

其中|A|表示矩阵A的行列式;

因为后续仿射传播聚类方法所需输入为相似度,所以将差异度取负得到相似度;基于每个品种多元高斯分布均值向量和方差矩阵的估计值,计算得到相似度矩阵;

步骤(3):基于仿射传播的产品特征聚类

仿射传播聚类是一种基于信息累积的聚类方法,根据不同点的累积信息量确定聚类中心,利用相似度矩阵计算两种信息量;对点i和点k,所涉及的两种信息量r(i,k)和a(i,k)为:

r(i,k)←s(i,k)-maxk*s.t.k*≠k{a(i,k*)+s(i,k*)}]]>

a(i,k)←Σi*≠kmax{0,r(i*,k)},(i=k)]]>

迭代开始设置a(i,k)=0,然后根据上式迭代的更新r(i,k)和a(i,k)直到收敛;

仿射传播聚类中用偏好向量表示先验知识中每个任务成为聚类中心的可能性;在迭代中用偏好向量代替相似度矩阵中的对角线元素进而影响聚类中心的选择;因为样本数目较多的产品品种后续会得到更加准确的模型,更适合作为聚类中心,为了将样本数目这一先验用于聚类的过程中,采用如下方法设置仿射传播方法中的偏好向量;

设偏好向量的设定值为p=[p1,p2,...,pm-1,pm]:

pi=(Ni-Max(Ni))×aNi>L1i={1,2,...,m-1,m}-L1×aNi≤L1i={1,2,...,m-1,m}]]>

其中L1表示希望样本数量大于L1的品种更倾向于成为聚类中心;设定a=0.005,b=2000,L=50;

步骤(4):基于共有参数提取的多任务学习

在聚类后得到的L个类别,对每个类别中的品种使用基于共有参数提取的多任务学习方法,其主要思想是将每个品种的模型参数分为两部分:共有参数和私有参数;共有参数是每个类别中所有品种的数据模型中相同的部分,用列向量表示;而私有参数是每个类别中每个品种的数据模型中不同的部分,用列向量表示;如果一个类别中有r个品种,则r个列向量v(i)可构成一个r列的矩阵V;基于共有参数提取的多任务学习方法可根据每个类别中的数据学习出这两部分的参数从而得到最终模型的参数,对第i个任务,最终的模型参数为:

wi=u+v(i)

在进行模型学习以前,需要先对数据进行归一化处理;然后设定模型的参数,包括λ1,λ2,λ3,随机初始化共有参数向量u和私有参数矩阵V;

迭代过程如下,其中X表示一类中r个品种的输入矩阵[X1,X2,...,Xr-1,Xr]纵向排列所构成的矩阵;同样用Y表示一类中r个品种的输出向量[y1,y2,...,yr-1,yr]纵向排列构成的列向量

对第k次迭代计算:

pk=uk-1-1lk-1▿uf(uk-1,Vk-1)]]>

qk(i)=max(0,1-λ3lk-1||sk(i)||2)sk(i)]]>

上式中:

Sk=Vk-1-1lk-1▿Vf(uk-1,Vt-1)]]>

▿uf(uk,Vk)=XTY-Xuk||Y-Xuk||2-2λ1Σi=1rXiT(yi-Xi(uk+vk(i)))+2λ2·uk]]>

▿Vf(uk,Vk)=-2λ1Σi=1rXiT(yi-Xi(uk+vk(i)))]]>

根据pk,uk-1和Qk,Vk-1更新uk,Vk

uk=pkk(pk-pk-1)

Vk=Qkk(Qk-Qk-1)

其中α∈[0,1],可令α0=0;t0=1,

在迭代过程中,步长lk采用如下方法确定:

其中jk为使得下式成立的最小非负正整数:

f(uk,Vk)≤Fuk,Vk,lk(uk+1,Vk+1)]]>

f(u,V)=||Y-Xu||2+λ1Σi=1r||yi-Xi(u+vi)||22+λ2||u||22]]>

Fuk,Vk,lk(u,V)=f(uk,Vk)+<u-uk,▿uf(uk,Vk)>+lk2||u-uk||22+<V-Vk,▿Vf(uk,Vk)>+lk2||V-Vk||F2]]>

对L个聚类所得的类别分别使用上述方法即可得到L个模型库,其包含了所有m个品种的模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410805040.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top