[发明专利]使用生物信息学字符集和和映射的生物信息学字体的基因组/蛋白质组序列的表示、可视化,比较以及报告在审
| 申请号: | 201280033367.2 | 申请日: | 2012-07-04 |
| 公开(公告)号: | CN103797487A | 公开(公告)日: | 2014-05-14 |
| 发明(设计)人: | R·辛格;S·库马尔;B·查克拉巴蒂 | 申请(专利权)人: | 皇家飞利浦有限公司 |
| 主分类号: | G06F19/26 | 分类号: | G06F19/26;G06F19/22 |
| 代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 王健 |
| 地址: | 荷兰艾*** | 国省代码: | 荷兰;NL |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 使用 生物 信息学 字符集 映射 字体 基因组 蛋白质 序列 表示 可视化 比较 以及 报告 | ||
1.一种方法,特征在于所述方法包括:
将基因组或蛋白质组数据编码为包括生物信息学字符集的字符的基因组或蛋白质组字符串,其中:
(i)基因组或蛋白质组数据的每个碱基或肽由生物信息学字符集(20)的单个字符表示,以及
(ii)所述生物信息学字符集的每个字符编码(I)碱基或肽和(II)与所述碱基或肽相关联的至少一个注释的数据值;以及
通过使用映射到生物信息学字符集的生物信息学字体(40)显示基因组或蛋白质组字符串来显示所述基因组或蛋白质组数据;
其中,所述编码和显示由数字处理设备(50)执行。
2.权利要求1的方法,其中所述生物信息学字符集的每个字符由:
(1)8位组成的单个字节,和
(2)16位组成的两个字节
中的一个表示,其中所述8位或16位的第一子集编码碱基或肽,及所述8位或16位的第二子集编码与所述碱基或肽相关联的至少一个注释的数据值。
3.权利要求1-2任一项的方法,其中
编码腺嘌呤碱基的生物信息学字符集的每个字符被映射到生物信息学字体的包含字母“A”或“a”的字体字符,
编码鸟嘌呤碱基的生物信息学字符集的每个字符被映射到生物信息学字体的包含字母“G”或“g”的字体字符,
编码胞嘧啶碱基的生物信息学字符集的每个字符被映射到生物信息学字体的包含字母“C”或“c”的字体字符,
编码胸腺嘧啶或尿嘧啶碱基的生物信息学字符集的每个字符被映射到生物信息学字体的包含字母“T”或“t”或字母“U”型或“u”的字体字符;以及
生物信息学字符集的至少一个字符使用表示两个或更多个候选碱基的代码来编码不确定的碱基。
4.权利要求3的方法,其中:
生物信息学字符集的每个字符编码指示所编码碱基的质量值的注释的数据值,并且生物信息学字体包括指示碱基质量值的区别标记。
5.权利要求1的方法,其中生物信息学字符集的至少四个字符被映射到生物信息学字体的字体字符,所述字体字符每个包括表示由该字符编码的碱基或肽的一个或多个字母以及表示所编码的至少一个注释的数据的一个或多个区别标记。
6.权利要求1-5任一项的方法,进一步包括:
在基因组或蛋白质组字符串上执行至少一个字符串函数以生成更新的基因组或蛋白质组字符串,其中至少一个碱基或肽由单个字符表示,所述单个字符编码至少一个附加的或修改的注释的数据,该注释的数据由所执行的字符串操作生成。
7.权利要求6的方法,其中所述执行包括:执行将所述基因组或蛋白质组字符串与参考基因组或蛋白质组字符串进行比较的字符串比较。
8.权利要求6-7任一项的方法,其中所述执行包括对基因组或蛋白质组字符串的字符执行逐位逻辑运算。
9.权利要求1-8任一项的方法,其中所述方法仅编码基因组数据,并且包括:
将基因组数据编码为包括生物信息学字符集的字符的基因组字符串,其中:
(i)基因组数据的每个碱基由生物信息学字符集(20)的单个字符表示,以及
(ii)生物信息学字符集的每个字符编码(I)碱基和(II)与该碱基相关联的至少一个注释的数据值;以及
通过使用映射到生物信息学字符集的生物信息学字体(40)显示基因组字符串来显示该基因组数据。
10.权利要求1-8任一项的方法,其中所述方法仅编码蛋白质组数据,并且包括:
将蛋白质组数据编码为包括生物信息学字符集的字符的蛋白质组字符串,其中:
(i)蛋白质组数据的每个肽由生物信息学字符集(20)的单个字符表示,以及
(ii)生物信息学字符集的每个字符编码(I)肽和(II)与该肽相关联的至少一个注释的数据值;并
通过使用映射到生物信息学字符集的生物信息学字体(40)显示蛋白质组字符串来显示该蛋白质组数据。
11.一种装置,其特征在于,该装置包括:
数字处理设备(50),配置为执行权利要求1-10的任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于皇家飞利浦有限公司,未经皇家飞利浦有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201280033367.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:植物切割设备
- 下一篇:在绝热反应级联中使用氧化铈催化剂制备氯气的方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





