[发明专利]一种T细胞受体序列motif组合识别检测方法、存储介质及设备有效
申请号: | 202110536816.6 | 申请日: | 2021-05-17 |
公开(公告)号: | CN113380324B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 王嘉寅;何欣诺;朱晓燕;秦秀昕;徐颖;张选平;赖欣 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G16B20/50 | 分类号: | G16B20/50;G16B30/10;G16B40/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 高博 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 细胞 受体 序列 motif 组合 识别 检测 方法 存储 介质 设备 | ||
1.一种T细胞受体序列motif组合识别检测方法,其特征在于,包括以下步骤:
S1、将健康样本和肿瘤样本的基因组DNA比对到胚系序列,鉴定对应的CDR3区段并将CDR3区段翻译成氨基酸序列;进行氨基酸序列剪切并将健康样本和肿瘤样本的CDR3区段对应的氨基酸序列解构为多个相同长度的连续氨基酸片段;利用健康样本的外周血数据、肿瘤样本的组织数据和肿瘤样本外周血数据解构后的信息构建Tumor-Health矩阵,利用肿瘤样本组织数据和肿瘤样本外周血数据构建Tissue-Blood矩阵,Tumor-Health矩阵和Tissue-Blood矩阵的最后一列为label列,代表样本对应的标签,剩余列为motif列,代表样本对应氨基酸片段的克隆数,将Tumor-Health矩阵和Tissue-Blood矩阵共同作为输入矩阵;
S2、根据步骤S1得出的两个输入矩阵分别构建求解对应的优化目标函数,以motif组合的类内类间距离可分性作为优化目标计算方法,将两个优化目标函数加和得到总的优化目标函数;
S3、根据步骤S1得到的输入矩阵和步骤S2得到的总优化目标函数设计双种群遗传算法并进行求解,确定编码方法和初始种群,采用锦标赛选择法加精英保留制度选择算子对种群进行选择,保留最优个体;采取种群内和种群间的混合交叉方式确定交叉算子;采用基本位变异的操作确定变异算子;
S4、对步骤S1构建的输入矩阵中的每一motif列和label列进行相关性分析,采用点二列相关性作为衡量motif列和label列是否相关的指标,根据计算得到的相关性指标ρ判断显著水平,确定相关性指标ρ0.05为相关性不显著;
S5、以步骤S2构建的优化目标函数作为算法优化目标,利用步骤S4计算的相关性指标对步骤S1构建的输入矩阵进行初步筛选,过滤掉不相关的motif列,通过步骤S3设计的双种群遗传算法进行迭代计算,得到两组种群的优势解,取两组种群中适应度排前三的染色体作为最优解,并解码成为对应的motif集合,最终得到六组motif集合,两两对应,取对应集合的交集作为最终挖掘出的motif,完成识别检测。
2.根据权利要求1所述的方法,其特征在于,步骤S1中,构建Tumor-Health矩阵和Tissue-Blood矩阵具体为:
肿瘤样本数为M,健康样本数为N,肿瘤样本外周血和组织测序的和为2M,第一个用于输入的矩阵Tumor-Health共有N+2M行,代表肿瘤样本外周血、组织的测序结果和健康样本外周血测序结果,第二个输入的矩阵Tissue-Blood共有2M行,代表肿瘤样本外周血和组织的测序结果,两个矩阵的每一行均包含一个向量C={C1,C2,...Cs,label},其中,s=8000,Ci代表样本中motif出现的计数,1≤i≤s,如果Ci=0则代表样本无对应motif,label代表样本对应的标签,在Tumor-Health矩阵中0代表正常的样本数据,1代表非正常的样本数据,在Tissue-blood矩阵中0代表非正常外周血数据,1代表非正常组织数据。
3.根据权利要求1所述的方法,其特征在于,步骤S2中,总优化目标函数min F(x)为:
min F(x)=F1(x)+F2(x)
其中,F1(x)为优化目标1,在Tumor-Health矩阵上进行类内类间距离可分计算,F2(x)为优化目标2,在Tissue-blood矩阵上进行类内类间距离可分计算。
4.根据权利要求1所述的方法,其特征在于,步骤S3中,确定编码方法和初始种群具体为:
采用二进制编码,使用二值符号集{0,1}构成种群中每个染色体的基因型,每一个二进制位对应一种motif,1表示染色体对应的可行解中包括对应motif,0表示不包含对应motif;对于两组数据采用随机生成的方式分别生成两个种群,然后通过交叉让两组数据中的优势基因进行互换,完成初始化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110536816.6/1.html,转载请声明来源钻瓜专利网。