[发明专利]一种DNA序列的可视化方法无效
申请号: | 201210095028.9 | 申请日: | 2012-03-31 |
公开(公告)号: | CN102708308A | 公开(公告)日: | 2012-10-03 |
发明(设计)人: | 曾湘祥 | 申请(专利权)人: | 常熟市支塘镇新盛技术咨询服务有限公司 |
主分类号: | G06F19/26 | 分类号: | G06F19/26 |
代理公司: | 苏州广正知识产权代理有限公司 32234 | 代理人: | 张利强 |
地址: | 215500 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 dna 序列 可视化 方法 | ||
技术领域
本发明涉及一种基因序列的可视化表示方法,属于生物信息学领域。
背景技术
DNA序列由A(腺嘌呤),T(胸腺嘧啶),G(鸟嘌呤),C(胞嘧啶)四个核苷酸组成。DNA数据可以以字符的形式储存于电脑中。这种方式虽便于保存,但是却不易于人们的观察。因此开发一种辅助工具来帮助 观察和分析DNA数据并从中挖掘有价值的信息,具有重要的实际意义。
自第一个DNA序列可视化模型提出以来,DNA序列可视化技术蓬勃发展,大量学者做出了巨大努力和贡献,但是在同一模型中同时解决以下五个问题是相当困难的,分别是:信息丢失问题,在高维空间难以观察的问题,退化问题,长DNA序列在二维空间难以观察的问题,需要反映有用信息的问题。因此,为解决以上问题,实现肉眼观察和分析DNA数据,亟待开发新型DNA序列可视化方法。
发明内容
[0006]
本发明的目的:本发明是一种改进的DNA序列可视化光谱模型,该模型将A,G,T,C四条平行线周期化显示,根据DNA序列出现的顺序通过跳转规则依次在图中标记连接成折线图,实现DNA序列的可视化。本发明提出的方法可以解决原有DNA序列可视化模型的退化问题,信息丢失问题,长DNA序列在二维空间内难以观察的问题以及需要反映有用信息的问题。
本发明的技术方案:
1)A,G,T,C平行线:等距离画出4条平行线,以A,G,T,C的顺序标记四条平行线。
2)A,G,T,C平行线的周期化:复制四条平行线,并在平面空间中的Y轴方向进行扩展。
3)跳转规则:该规则包括两个部分:1、当一段DNA序列的核苷酸数量大于等于10时,根据该段序列最后一个核苷酸的信息进行正或者负跳转;2、当一段序列包含了完整的A,G,T,C核苷酸信息时,根据该段序列最后一个核苷酸的信息进行正或者负跳转(若结尾核苷酸为A时,则向Y轴负方向跳一个周期;若结尾核苷酸为G时,则向Y轴负方向跳两个周期;若结尾核苷酸为T时,则向Y轴正方向跳一个周期;若结尾核苷酸为C时,则向Y轴正方向跳两个周期)。
本发明与现有技术相比具有以下有益效果:
原光谱图模型为二维可视化模型,并能同时解决退化问题和数据丢失问题。但是当DNA序列长度较长时,原光谱模型的可视化效果就会变差。而本发明在具有原光谱模型的优点基础上,还克服了原光谱模型的缺点:本发明不仅不会出现退化和信息丢失问题,而且不论DNA序列是长或短,都能在二维空间里呈现较好的图形效果,并反映DNA序列的长度。
附图说明
参照下图,通过示例方式描述本发明,其中:
图1为初始光谱图,其中,A,G,T,C四条平行线等距离的画出,并且标记出来;
图2为周期化光谱图,其中,A,G,T,C平行线周期化图;
图3为按照DNA序列中的核苷酸顺序,依照跳转规则在图2中的平行线上做上标记;
图4是在图3的基础上,把相邻的点用直线连接,并得到最后的表示图。
具体实施方式
DNA序列可视化是指建立DNA序列的折线图,即以图形的形式将DNA序列表示出来,从而避开字符串,通过观察图片达到分析和理解DNA序列的目的,帮助人们挖掘DNA序列的有价值信息。
利用MATLAB执行本发明的方法。参照图1到图4说明本发明的DNA序列可视化方法的具体实施方式。
参照图1,首先等距离画出四条平行线,并且以A,G,T,C的顺序标记四条平行线。第一个为核苷酸A(腺嘌呤),标记第一条平行线为A。第二个为G(鸟嘌呤),标记第二条平行线为G,以此类推。
参照图2,将A,G,T,C四条平行线周期化显示。
3,根据给定的DNA序列并依照跳转规则,在图2 中做标记(即图3中的DNA序列为“ATGGTGCATCGAAGGC”)。由图3所示,第一个核苷酸为A,在第一个位置的A线上做标记。第二个核苷酸为T,在第二个位置的T线上做标记。以此类推,直到该段核苷酸的个数大于等于10个或者当DNA序列包含完整的A,G,T,C核苷酸信息时,根据该段中最后一个核苷酸的信息,发生跳转。例如,该段DNA序列中的前7个核苷酸信息“ATGGTGC”中正好包含了完整的A,G,T,C信息,同时由于“ATGGTGC” 结尾处的核苷酸信息为C。因此,根据跳转规则,之后的DNA序列(“ATCGAAGGC”)要从当前位置沿Y轴正方向两个周期的A平行线开始标记,并以此类推。
参照图4,把相邻的点用直线连接起来,得到最后的表示图。这里第一个点是A,第二个点是T,因此在A与T之间用直线连接。第三个点是G,因此将T和G连接,以此类推。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常熟市支塘镇新盛技术咨询服务有限公司,未经常熟市支塘镇新盛技术咨询服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210095028.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:财务管理系统
- 下一篇:一种皮革削匀机刀辊带传动张紧装置
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用