[发明专利]一种多组学数据聚类方法及装置有效

申请号：	202010019135.8	申请日：	2020-01-08
公开（公告）号：	CN111223528B	公开（公告）日：	2023-04-18
发明（设计）人：	蔡宏民;容文滔	申请（专利权）人：	华南理工大学
主分类号：	G16B40/30	分类号：	G16B40/30
代理公司：	广州三环专利商标代理有限公司 44202	代理人：	郭浩辉;麦小婵
地址：	510000***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种多组学数据方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种多组学数据聚类方法，其特征在于，包括：

获取待测样本的多个原始组学数据，并对所述原始组学数据进行标准化，得到组学数据；

构建每个所述组学数据的局部相似矩阵，具体包括：所述局部相似矩阵由以下公式确定，具体公式如下：

Z(i,j)＝(Z(i,j)+Z(j,i))/2

其中，Z为所述局部相似矩阵，W(i,j)为待测样本i与待测样本j的高斯核相似度，W(i,k)为待测样本i与待测样本k的高斯核相似度，d(x_i,x_j)为待测样本i与待测样本j之间的欧式距离，μ为用于控制指数衰减速度的比例常数，∈_i,j矫正度量误差参数，N_i为待测样本K的最近邻集合；

将所述局部相似矩阵输入到预设的谱聚类模型，得到每个所述组学数据的聚类结果，并基于所述聚类结果更新所述局部相似矩阵；其中，根据每个所述组学数据的聚类结果，建立聚类矩阵；根据以下公式更新所述局部相似矩阵：

Z^v＝Z^v′*Ω^v

其中，Z^v′为每个所述组学数据的局部相似矩阵，Z^v为更新后的局部相似矩阵；Ω^v为所述聚类矩阵，当所述聚类结果为两个所述待测样本的同一组学数据处于同一个聚类簇时，Ω^v(i,j)＝1；当所述聚类结果为两个所述待测样本的同一组学数据处于同一个聚类簇时，Ω^v(i,j)＝0；

根据更新后的局部相似矩阵建立优化模型，并通过求解所述优化模型，得到全局相似度矩阵；所述根据更新后的局部相似矩阵建立优化模型，具体包括：根据以下公式得到所述优化模型：

其中，S为所述全局相似度矩阵，ω为权重，ω^v为每个所述组学数据的权重，ω^T为所有所述组学数据的权重之和，v为组学数据的类型，m为组学数据的类型总个数，Z_i^v为更新后的局部相似矩阵的行向量，Z_j^v为更新后的局部相似矩阵的列向量，α、β为对应正则项的参数，diag(S)为所述全局相似度矩阵的对角元素组成向量，为所述全局相似度矩阵的块对角结构，T为所述全局相似度矩阵的替代矩阵，L_s为所述全局相似度矩阵的拉普拉斯矩阵，c为所述替代矩阵的对角块个数；

所述通过求解所述优化模型，得到全局相似度矩阵，具体包括：引入替代变量、惩罚系数及拉格朗日乘子，所述优化模型由以下公式确定，具体公式如下：

0≤w_v≤1，tr(T)＝c

其中，S1为第一替代变量，S2为第二替代变量，μ₁为第一惩罚系数，μ₂为第二惩罚系数，Λ₁为第一拉格朗日乘子，Λ₂为第二拉格朗日乘子；

迭代地执行以下步骤，直至达到预设的收敛条件，获得最终的全局相似度矩阵：固定所述第一替代变量、所述第二替代变量、所述全局相似度矩阵及所述权重，更新所述替代矩阵；固定所述第一替代变量、所述第二替代变量、所述替代矩阵及所述权重，更新所述全局相似度矩阵；固定所述全局相似度矩阵、所述第二替代变量、所述替代矩阵及所述权重，更新所述第一替代变量；固定所述全局相似度矩阵、所述第一替代变量、所述替代矩阵及所述权重，更新所述第二替代变量；固定所述全局相似度矩阵、所述第一替代变量、所述替代矩阵及所述第二替代变量，更新所述权重；更新所述第一惩罚系数、所述第二惩罚系数、所述第一拉格朗日乘子及所述第二拉格朗日乘子；

将所述全局相似度矩阵输入到所述谱聚类模型，得到所述待测样本的亚型识别结果。

2.一种多组学数据聚类装置，其特征在于，包括：

数据获取模块，用于获取待测样本的多个原始组学数据，并对所述原始组学数据进行标准化，得到组学数据；

局部相似矩阵构建模块，用于构建每个所述组学数据的局部相似矩阵；所述局部相似矩阵构建模块包括局部相似矩阵计算单元；所述局部相似矩阵计算单元，用于所述局部相似矩阵由以下公式确定，具体公式如下：

Z(i,j)＝(Z(i,j)+Z(j,i))/2

局部相似矩阵更新模块，用于将所述局部相似矩阵输入到预设的谱聚类模型，得到每个所述组学数据的聚类结果，并基于所述聚类结果更新所述局部相似矩阵；所述局部相似矩阵更新模块包括聚类矩阵构建单元和局部相似矩阵更新运算单元；所述聚类矩阵构建单元，用于根据每个所述组学数据的聚类结果，建立聚类矩阵；所述局部相似矩阵更新运算单元，用于根据以下公式更新所述局部相似矩阵：

Z^v＝Z^v′*Ω^v

全局相似度矩阵构建模块，用于根据更新后的局部相似矩阵建立优化模型，并通过求解所述优化模型，得到全局相似度矩阵；所述全局相似度矩阵构建模块包括优化模型构建单元、参数引入单元和迭代单元；所述优化模型构建单元，用于根据以下公式得到所述优化模型：

其中，S为所述全局相似度矩阵，ω为权重，ω^z为每个所述组学数据的权重，ω^T为所有所述组学数据的权重之和，v为组学数据的类型，m为组学数据的类型总个数，Z_i^v为更新后的局部相似矩阵的行向量，Z_j^v为更新后的局部相似矩阵的列向量，α、β为对应正则项的参数，diag(S)为所述全局相似度矩阵的对角元素组成向量，为所述全局相似度矩阵的块对角结构，T为所述全局相似度矩阵的替代矩阵，L_S为所述全局相似度矩阵的拉普拉斯矩阵，c为所述替代矩阵的对角块个数；

所述参数引入单元，用于引入替代变量、惩罚系数及拉格朗日乘子，所述优化模型由以下公式确定，具体公式如下：

0≤ω_v≤1，tr(T)＝c

其中，S1为第一替代变量，S2为第二替代变量，μ₁为第一惩罚系数，μ₂为第二惩罚系数，Λ₁为第一拉格朗日乘子，Λ₂为第二拉格朗日乘子；

所述迭代单元，用于迭代地执行以下步骤，直至达到预设的收敛条件，获得最终的全局相似度矩阵：固定所述第一替代变量、所述第二替代变量、所述全局相似度矩阵及所述权重，更新所述替代矩阵；固定所述第一替代变量、所述第二替代变量、所述替代矩阵及所述权重，更新所述全局相似度矩阵；固定所述全局相似度矩阵、所述第二替代变量、所述替代矩阵及所述权重，更新所述第一替代变量；固定所述全局相似度矩阵、所述第一替代变量、所述替代矩阵及所述权重，更新所述第二替代变量；固定所述全局相似度矩阵、所述第一替代变量、所述替代矩阵及所述第二替代变量，更新所述权重；更新所述第一惩罚系数、所述第二惩罚系数、所述第一拉格朗日乘子及所述第二拉格朗日乘子；

聚类识别模块，用于将所述全局相似度矩阵输入到所述谱聚类模型，得到所述待测样本的亚型识别结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010019135.8/1.html，转载请声明来源钻瓜专利网。

上一篇：提高电动汽车购买率的优化方法和系统
下一篇：基于实时数据库存储的数据清洗方法和系统及存储介质

同类专利

专利分类

G 物理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种多组学数据聚类方法及装置有效

专利文献下载