[发明专利]基于Linux单命令行的生物大数据分析系统及方法有效
申请号: | 202010764734.2 | 申请日: | 2020-07-31 |
公开(公告)号: | CN111880843B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 冉隆科;宋方洲;宋晶;罗瑞函 | 申请(专利权)人: | 重庆医科大学 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/50;G06F9/448 |
代理公司: | 重庆双马智翔专利代理事务所(普通合伙) 50241 | 代理人: | 顾晓玲;陈香兰 |
地址: | 400016*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 linux 命令行 生物 数据 分析 系统 方法 | ||
本发明公开了一种基于Linux单命令行的生物大数据分析系统及方法。包括接入模块,用户访问时链接到Shell模式界面;Shell模式界面,输入Linux单命令行,产生作业号,Linux单命令行至少包括程序单元名称和待分析数据文件名称;用户级别获取单元;用户资源管理模块,根据用户级别获取单元输出的用户的级别为用户分配对应级别的系统子资源;分析模块,包含多个程序单元;作业调度管理模块,将作业号分配至与用户级别对应的作业队列中,调度作业号关联的程序单元并执行获得分析结果。只需Linux单命令行就可完成数据分析和作业提交,对资源和作业队列进行分级别管理,优化资源,提升使用效率,提高系统稳定性。
技术领域
本发明涉及生物信息学多组学和计算生物学领域的数据分析,特别是涉及一种基于Linux单命令行的生物大数据分析系统及方法。
背景技术
随着二代基因测序技术和蛋白质谱技术等在内的新一代高通量数据技术越来越多的应用于解决生物问题,尤其是人类疾病的研究。使得从基因组水平、转录组水平、蛋白质组水平、代谢组水平等角度对疾病展开全方位、多层次的研究成为可能,借助生物信息学分析方法进行多组学整合研究,能更加系统地阐释疾病的发生及发展机理,为疾病(如肿瘤)的诊断治疗提供强有力的工具。
现有的肿瘤大数据分析系统绝大多数是基于windows,系统框图如图9所示,其运行模式为:通过在线web端来访问,用户通过上传数据并提交到服务器,服务器接收数据进行处理,最后反馈结果给用户。在基于windows的肿瘤大数据分析系统下,用户使用方便,分析的结果可视化直观,但其缺点是很明显的:由于受windows架构缺陷的限制,决定了用户上传数据的文件大小受到限制,较大的文件不易上传到系统,同时用户还受到网络带宽的限制,这些因素决定了windows下的肿瘤数据分析系统不易推广使用。
现有技术中也有基于Linux的肿瘤大数据分析系统,其运行模式为:用户通过远程登录程序,如windows下的putty命令来进行远程登录服务器,通过运行R语言,调用已编制好的R脚本程序来进行数据处理,运行完之后通过相关的Linux命令来查看结果。在此过程中,用户需要单独编制程序、调试程序、运行程序,最后通过qsub程序来提交作业到服务器,整个过程耗时耗力,并严重制约着分析平台的推广和使用。需要用户有熟练使用Linux命令的经验,由于每一个操作都需要通过输入Linux命令来完成,因而用户操作起来复杂;对于用户分析数据过程来说,更需要用户自己手动编写代码来运行和调试程序;对于定制的数据分析更没有现存的不需要修改的代码直接可用,这对于没有编程基础的用户来说更增加了使用的复杂性,制约着该方式的使用。
此外,不管是基于windows还是基于Linux系统,对于多用户同时使用分析系统来进行数据分析,都会受到服务器性能的限制,包括线程、内存和存储空间。在Linux服务器系统下,一般都存在多个用户同时使用的情况,在该系统下,如果不对每个用户使用的资源(包括线程、内存和存储空间)进行控制,就会严重制约服务器的性能,从而大大降低服务器的使用效率。
发明内容
本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种基于Linux单命令行的生物大数据分析系统及方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆医科大学,未经重庆医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010764734.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据传输方法、装置、设备及介质
- 下一篇:声音信号传输控制电路及耳机