[发明专利]基因分析数据库批量数据导入方法和系统在审
申请号: | 201710158995.8 | 申请日: | 2017-03-17 |
公开(公告)号: | CN108628872A | 公开(公告)日: | 2018-10-09 |
发明(设计)人: | 盛司潼;蔡思岑;黄哲鹏 | 申请(专利权)人: | 广州康昕瑞基因健康科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省广州市萝*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 基因分析 批量数据 数据组 验证 上传 出错 导入系统 失败原因 验证数据 预设规则 合法性 写入 存储 | ||
本发明涉及一种基因分析数据库批量数据导入方法,该方法包括上传包括多个数据组的第一Excel文件;根据预设规则验证数据组每个数据的合法性;存储通过验证的数据组至数据库;以及生成第二Excel文件,将验证出错的一个或多个数据组写入所述第二Excel文件并提供每个出错的数据组的失败原因。本发明还提供一种基因分析数据库批量数据导入系统,本发明的基因分析数据库批量数据导入方法和系统方便用户及时修改验证错误的数据并重新上传数据库。
技术领域
本发明涉及基因测序领域,更具体地说,本发明涉及一种基因分析数据库批量数据导入方法和系统。
背景技术
基因测序需要处理大量的数据,现有数据库通常根据实验结果人工导入相关数据,或者使用Excel文件批量导入数据库需要录入的数据同时现有技术一般会对数据导入的情况进行统计和显示以方便用户了解数据导入的问题。虽然使用Excel文件导入数据解决了用户批量导入的问题,但是当导入数据的错误较多时,庞大的数据使用户很难根据导入统计信息及时更正和重新导入验证出错的数据,因此有必要提供一种基因分析数据库批量数据导入方法或系统,用于方便用户及时修改验证错误的数据并重新上传数据库。
发明内容
本发明的目的在于提供一种基因分析数据库批量数据导入方法和系统,旨在解决用户修改验证错误的数据并重新上传数据库不方便的问题。
一种基因分析数据库批量数据导入方法包括:
上传包括多个数据组的第一Excel文件;
根据预设规则验证数据组每个数据的合法性;
存储通过验证的数据组至数据库;以及
生成第二Excel文件,将验证出错的一个或多个数据组写入所述第二Excel文件并提供每个出错的数据组的失败原因。
进一步地,所述第二Excel文件的表头栏位包括第一Excel文件的表头栏位以及失败原因栏位。
进一步地,所述基因分析数据库批量数据导入方法还包括将验证出错的行序、出错数据栏位名称及错误原因或修改建议写入数组并缓存。
进一步地,所述基因分析数据库批量数据导入方法还校验通过验证的数据组是否已经存在于数据库内,并将行序和存在原因存储在缓存的数组中。
进一步地,所述生成第二Excel文件包括:根据缓存数据遍历第一Excel文件将缓存行序对应的数据组写入第二Excel文件并在失败原因栏位写入行序对应的出错数据栏位名称及错误原因或修改建议或存在原因。
进一步地,上传包括多个数据组的第一Excel文件之前,进一步生成模板Excel文件,所述模板Excel文件定义对应数据库的多个栏位的名称及数据类型。
进一步地,所述预设规则包括验证第一Excel文件的大小、第一Excel文件的名称和/或第一Excel文件的格式。
进一步地,所述基因分析数据库批量数据导入方法还包括显示数据组的验证信息的统计结果。
一种基因分析数据库批量数据导入系统包括:
上传模块,用于控制上传包括多个数据组的第一Excel文件;
验证模块,用于根据预设规则验证数据组每个数据的合法性;
存储模块,用于存储通过验证的数据组至数据库;以及
错误提示模块,用于生成第二Excel文件,将验证出错的一个或多个数据组写入所述第二Excel文件并提供每个出错的数据组的失败原因。
进一步地,所述第二Excel文件的表头栏位包括第一Excel文件的表头栏位以及失败原因栏位。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州康昕瑞基因健康科技有限公司,未经广州康昕瑞基因健康科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710158995.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于链接特征的链接去重方法
- 下一篇:一种文本分类方法、装置和设备