[发明专利]一种基因分类方法与装置有效
| 申请号: | 201810046229.7 | 申请日: | 2018-01-17 |
| 公开(公告)号: | CN108171012B | 公开(公告)日: | 2020-09-22 |
| 发明(设计)人: | 孙林;刘弱南;张霄雨;孟新超;常宝方;孟玲玲;王蓝莹;陈岁岁;殷腾宇;李源 | 申请(专利权)人: | 河南师范大学 |
| 主分类号: | G16B40/00 | 分类号: | G16B40/00 |
| 代理公司: | 郑州睿信知识产权代理有限公司 41119 | 代理人: | 吴敏 |
| 地址: | 453007 *** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基因 分类 方法 装置 | ||
1.一种基因分类方法,其特征在于,包括以下步骤:
1)获取基因表达数据,基因表达数据中包含设定数量的样本,每一样本中包含设定数量的基因,将基因表达数据中各基因进行排列组合形成矩阵,形成的矩阵为基因表达数据矩阵;
2)采用局部线性嵌入算法对所述基因表达数据矩阵进行降维,计算基因表达数据矩阵的线性嵌入矩阵,得到降维后的特征基因子集;
3)采用近邻传播聚类算法对所述特征基因子集进行聚类,得到基因的聚类结果;
近邻传播聚类算法中相似度矩阵的构造包括如下步骤:
对特征基因子集中的样本分别建立全局核函数和局部核函数,并对全局核函数和局部核函数进行线性加权,线性加权后得到的函数作为相似性度量来计算所述相似度矩阵;
所述全局核函数包括F型核函数,计算式如下:
式中,K(yi,yj)为F型核函数,yi和yj均为所述特征基因子集中的样本,β为核函数的参数,β∈R。
2.根据权利要求1所述的基因分类方法,其特征在于,所述局部核函数包括高斯核函数,所述全局核函数还包括线性核函数、多项式核函数和sigmoid核函数。
3.根据权利要求1所述的基因分类方法,其特征在于,步骤2)包括以下子步骤:
2-1)计算基因表达数据矩阵中所有样本的k个最近邻点;
2-2)根据各个样本的k个最近邻点,构建局部重构权值矩阵;
2-3)利用所述局部重构权值矩阵,计算基因表达数据矩阵的线性嵌入矩阵,得到所述降维后的特征基因子集。
4.根据权利要求1所述的基因分类方法,其特征在于,全局核函数的参数和局部核函数的参数通过粒子群算法进行寻优得到。
5.根据权利要求1-2任一项所述的基因分类方法,其特征在于,所述近邻传播聚类算法对特征基因子集的聚类包括以下子步骤:
3-1)初始化可信度r(i,k)和可用度a(i,k),可信度r(i,k)表示样本yi适合做样本yk的类代表点的代表程度,可用度a(i,k)表示样本yi选择样本yk做类代表点的适合程度;
3-2)根据近邻传播聚类算法,利用所述构造的相似度矩阵分别迭代计算可信度r(i,k)和可用度a(i,k),直到达到设定迭代次数或迭代收敛,输出基因的聚类结果。
6.根据权利要求5所述的基因分类方法,其特征在于,可信度r(i,k)和可用度a(i,k)的迭代公式如下:
rt(i,k)=(1-λ)×rt(i,k)+λ×rt-1(i,k)
at(i,k)=(1-λ)×at(i,k)+λ×at-1(i,k)
式中,rt(i,k)为第t次迭代时可信度的值,rt–1(i,k)为第t–1次迭代时可信度的值,λ为阻尼因子,at(i,k)为第t次迭代时可用度的值,at–1(i,k)为第t–1次迭代时可用度的值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南师范大学,未经河南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810046229.7/1.html,转载请声明来源钻瓜专利网。





