[发明专利]疾病相关蛋白数据库有效
申请号: | 201810934402.7 | 申请日: | 2018-08-16 |
公开(公告)号: | CN109086574B | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 马旭;路建波 | 申请(专利权)人: | 国家卫生健康委科学技术研究所 |
主分类号: | G16B50/30 | 分类号: | G16B50/30;G16B45/00 |
代理公司: | 北京市中伦律师事务所 11410 | 代理人: | 杨黎峰;钟锦舜 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 疾病 相关 蛋白 数据库 | ||
本发明涉及一种疾病相关蛋白数据库及其构建方法和应用。该数据库具有现有疾病相关蛋白数据信息收录广泛、更新及时、包含结构信息、无需本地安装且访问速度快的特点。同时提供了该疾病相关蛋白数据库的构建方法,以及在科学研究中的应用。
技术领域
本发明涉及生物信息学领域。具体地,本发明涉及疾病相关蛋白数据库,其构建方法,以及该数据库应用。
背景技术
蛋白是生物体重要的组成成分,具有重要的生物学功能,如作为生物催化剂、调节代谢、免疫保护、物质的转运和存储、细胞间信号传递等。许多疾病的发生和机体内的蛋白发生变异相关,例如镰刀型细胞贫血病,即是由于基因突变导致亚基N端的第6个氨基酸残基由正常的带负电的极性亲水谷氨酸残基(Glu)变成了不带电的非极性疏水缬氨酸(Val),即由正常的蛋白变异为疾病相关蛋白,进而使得红细胞扭曲成镰刀状,由于这种僵硬的镰刀状红细胞不能通过毛细血管,加上镰刀状细胞的血红蛋白的凝胶化使血液粘滞度增大,阻塞毛细血管,进而引起局部组织器官缺血缺氧,产生脾肿大、胸腹疼痛等症状。而蛋白的变异多源于基因变异。
人类遗传相关的疾病长期以来一直威胁着人们的健康与生命,随着遗传学与分子生物学的技术和研究进展,许多由于氨基酸序列的改变而导致的人类遗传相关疾病的基因变异己被鉴定。根据已发现的可引起蛋白序列发生变异从而导致疾病发生的基因变异信息,人们建立了多种相应的基因突变数据库,如人类基因突变数据库(HGMD)、基因组数据库(GDB)、在线人类孟德尔遗传信息数据库(OMIM)、ClinVar、RefGene等。
总体来说,与人类疾病相关的突变数据库大致可分为两大类,一类是综合的突变数据库,如OMIM、HGMD等,其中NCBI的OMIM数据库提供了大概20,000条左右的记录,专门记载着与疾病有关的突变信息。但是信息仅以文本为主方式记录,如基因名称、突变信息、以及专家所提供的注释,而并没有提供蛋白突变的序列。而人类基因突变数据库HGMD,收录了大概60,000个左右的突变信息,但未收录突变的氨基酸序列,并且不提供批量下载,还需要商业授权。同时,OMIM和HGMD这两个权威库中并没有互相覆盖,所以来自这两个数据库的相同基因所具有的突变数量也不一致,其中有几百个完全大相径庭,也就是说迄今为止,不管是OMIM还是HGMD都没有完全建立收录到所有己知的与疾病相关的人类突变蛋白质序列。另一类是专门的突变蛋白数据库。以PMD为代表,该数据库是由DDBJ的研究小组在上个世纪九十年代收集并开发的突变蛋自质数据库,他们从大量文献中收集了来自不同物种(包括人类在内)的大量突变蛋白质序列,在目前版本中共有来自459个不同条目的218,193条突变蛋白质序列,其中部分突变序列含有疾病信息,然而,该数据库自2007年3月起至今尚未更新,因此其所收集的突变蛋白质序列数量仍然有限,至少不可能涵盖在2007年3月以后发现的任何新的与疾病相关的人类突变蛋白质。另外,Swissprot也收集了54,018个人类基因的polymomhism和部分与疾病相关的突变位点数据其中一部分记录具有编号记载的疾病信息。
大量的疾病相关蛋白的信息散布在科学文献和各类生物学数据库中,为了帮助相关研究者方便使用这些数据并发现数据之间的有用的关联,有必要系统构建了一个整合各种信息渠道中的与疾病相关的人类突变蛋白质序列集和蛋白结构数据库。构建这样的数据库是非常有意义的,具体表现在:首先,可以将分散在全球形式不同的疾病蛋白数据统一管理和维护,方便研究人员进行查询;其次,建立针对性更强的疾病相关蛋白数据库,可利用大数据的技术挖掘隐含在疾病蛋白数据背后的规律和意义,帮助研究者针对疾病的发生和发展进行研究。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家卫生健康委科学技术研究所,未经国家卫生健康委科学技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810934402.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多源生物大数据融合系统
- 下一篇:一种软件许可证的授权方法和系统