[发明专利]一种DNA序列的可视化方法无效

专利信息
申请号: 201210095028.9 申请日: 2012-03-31
公开(公告)号: CN102708308A 公开(公告)日: 2012-10-03
发明(设计)人: 曾湘祥 申请(专利权)人: 常熟市支塘镇新盛技术咨询服务有限公司
主分类号: G06F19/26 分类号: G06F19/26
代理公司: 苏州广正知识产权代理有限公司 32234 代理人: 张利强
地址: 215500 江苏省*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 dna 序列 可视化 方法
【说明书】:

技术领域

发明涉及一种基因序列的可视化表示方法,属于生物信息学领域。 

背景技术

DNA序列由A(腺嘌呤),T(胸腺嘧啶),G(鸟嘌呤),C(胞嘧啶)四个核苷酸组成。DNA数据可以以字符的形式储存于电脑中。这种方式虽便于保存,但是却不易于人们的观察。因此开发一种辅助工具来帮助 观察和分析DNA数据并从中挖掘有价值的信息,具有重要的实际意义。 

自第一个DNA序列可视化模型提出以来,DNA序列可视化技术蓬勃发展,大量学者做出了巨大努力和贡献,但是在同一模型中同时解决以下五个问题是相当困难的,分别是:信息丢失问题,在高维空间难以观察的问题,退化问题,长DNA序列在二维空间难以观察的问题,需要反映有用信息的问题。因此,为解决以上问题,实现肉眼观察和分析DNA数据,亟待开发新型DNA序列可视化方法。 

发明内容

 [0006]

本发明的目的:本发明是一种改进的DNA序列可视化光谱模型,该模型将A,G,T,C四条平行线周期化显示,根据DNA序列出现的顺序通过跳转规则依次在图中标记连接成折线图,实现DNA序列的可视化。本发明提出的方法可以解决原有DNA序列可视化模型的退化问题,信息丢失问题,长DNA序列在二维空间内难以观察的问题以及需要反映有用信息的问题。

本发明的技术方案: 

1)A,G,T,C平行线:等距离画出4条平行线,以A,G,T,C的顺序标记四条平行线。

2)A,G,T,C平行线的周期化:复制四条平行线,并在平面空间中的Y轴方向进行扩展。 

3)跳转规则:该规则包括两个部分:1、当一段DNA序列的核苷酸数量大于等于10时,根据该段序列最后一个核苷酸的信息进行正或者负跳转;2、当一段序列包含了完整的A,G,T,C核苷酸信息时,根据该段序列最后一个核苷酸的信息进行正或者负跳转(若结尾核苷酸为A时,则向Y轴负方向跳一个周期;若结尾核苷酸为G时,则向Y轴负方向跳两个周期;若结尾核苷酸为T时,则向Y轴正方向跳一个周期;若结尾核苷酸为C时,则向Y轴正方向跳两个周期)。 

本发明与现有技术相比具有以下有益效果:

原光谱图模型为二维可视化模型,并能同时解决退化问题和数据丢失问题。但是当DNA序列长度较长时,原光谱模型的可视化效果就会变差。而本发明在具有原光谱模型的优点基础上,还克服了原光谱模型的缺点:本发明不仅不会出现退化和信息丢失问题,而且不论DNA序列是长或短,都能在二维空间里呈现较好的图形效果,并反映DNA序列的长度。

附图说明

参照下图,通过示例方式描述本发明,其中: 

图1为初始光谱图,其中,A,G,T,C四条平行线等距离的画出,并且标记出来;

图2为周期化光谱图,其中,A,G,T,C平行线周期化图;

图3为按照DNA序列中的核苷酸顺序,依照跳转规则在图2中的平行线上做上标记;

图4是在图3的基础上,把相邻的点用直线连接,并得到最后的表示图。

具体实施方式

DNA序列可视化是指建立DNA序列的折线图,即以图形的形式将DNA序列表示出来,从而避开字符串,通过观察图片达到分析和理解DNA序列的目的,帮助人们挖掘DNA序列的有价值信息。 

利用MATLAB执行本发明的方法。参照图1到图4说明本发明的DNA序列可视化方法的具体实施方式。 

参照图1,首先等距离画出四条平行线,并且以A,G,T,C的顺序标记四条平行线。第一个为核苷酸A(腺嘌呤),标记第一条平行线为A。第二个为G(鸟嘌呤),标记第二条平行线为G,以此类推。 

参照图2,将A,G,T,C四条平行线周期化显示。 

3,根据给定的DNA序列并依照跳转规则,在图2 中做标记(即图3中的DNA序列为“ATGGTGCATCGAAGGC”)。由图3所示,第一个核苷酸为A,在第一个位置的A线上做标记。第二个核苷酸为T,在第二个位置的T线上做标记。以此类推,直到该段核苷酸的个数大于等于10个或者当DNA序列包含完整的A,G,T,C核苷酸信息时,根据该段中最后一个核苷酸的信息,发生跳转。例如,该段DNA序列中的前7个核苷酸信息“ATGGTGC”中正好包含了完整的A,G,T,C信息,同时由于“ATGGTGC” 结尾处的核苷酸信息为C。因此,根据跳转规则,之后的DNA序列(“ATCGAAGGC”)要从当前位置沿Y轴正方向两个周期的A平行线开始标记,并以此类推。 

参照图4,把相邻的点用直线连接起来,得到最后的表示图。这里第一个点是A,第二个点是T,因此在A与T之间用直线连接。第三个点是G,因此将T和G连接,以此类推。 

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常熟市支塘镇新盛技术咨询服务有限公司,未经常熟市支塘镇新盛技术咨询服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210095028.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top