[发明专利]基因数据无损压缩方法、集成电路及无损压缩设备有效
申请号: | 202110632382.X | 申请日: | 2021-06-07 |
公开(公告)号: | CN113285720B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 谭光明;刘万奇;李叶文;康宁;孙凝晖 | 申请(专利权)人: | 中科计算技术西部研究院 |
主分类号: | H03M7/30 | 分类号: | H03M7/30 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 黄书凯 |
地址: | 401120 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因 数据 无损 压缩 方法 集成电路 设备 | ||
1.基因数据无损压缩方法,其特征在于,包括以下步骤:
S1、将基因数据分割为若干数据字段;所述步骤S1中,将基因数据根据数据类型分割,取得对应数据类型的数据字段;所述数据类型包括名字信息、基因序列信息和基因序列信息中碱基对应的质量分数信息;
S2、根据各数据字段的数据特点以及实际压缩需求选择压缩算子,并组合为压缩算法;所述步骤S2中,所述压缩算子分类存储在算子池中,并列表记录各种类压缩算子的自身特点和适用场景,以及列表记录各压缩算法的自身特点和适用场景,所述自身特点和实际压缩需求均包括压缩率和压缩效率;所述压缩算子的类型包括数据转换类、熵编码类以及其他无损一般编码类;所述步骤S2具体包括以下步骤:
S21、从压缩算子和压缩算法中,根据各数据字段的数据特点,和压缩算子或压缩算法的适用场景,选择出数据特点与适用场景相匹配的压缩算法集;
S22、根据实际压缩需求从压缩算法集中选择符合条件的最优压缩算法;
S3、将各数据字段根据对应的压缩算法进行压缩处理;
S4、将各数据字段的压缩结果进行合并;所述步骤S4中,各数据字段压缩结果的合并方式为:将各数据字段压缩结果以特定的格式存储在同一文件中,并在文件的文件头中以存储顺序标明各个数据字段所选择的压缩算法中所包含的压缩算子的组合;
所述步骤S1中,还包括以下步骤:
S101、将N个数据字段中的每个数据字段分割为M个数据块;
所述步骤S2中,还包括以下步骤:
S201、将压缩算法中的压缩算子并行设置,并设置为M条相同的压缩流水线;每个数据字段分别分配M条相同的压缩流水线;
S202、获取压缩流水线的第一并行度KN,并根据第一并行度KN获取第N个数据字段的第二并行度M*KN;
S203、根据每个数据字段的第二并行度M*KN,分析每个数据字段完成压缩的完成时间,并记录完成的同步率;
S204、判断同步率是否符合设定值,若不符合,则调整压缩流水线中的压缩算子或压缩算法的组合,获取压缩流水线的第一并行度KN’和每个数据字段的第二并行度M*KN’;
S205、重复执行步骤S203和步骤S204,直至同步率符合设定值;
S5、根据第一并行度KN和第二并行度M*KN分析基因数据的压缩性能;
所述步骤S5具体包括以下步骤:
S501、根据第一并行度KN,获取Min(KN);
S502、根据每个数据字段的第二并行度M*KN,获取基因数据的第三并行度M*N*Min(KN);
S503、根据第三并行度M*N*Min(KN)分析基因数据的压缩性能。
2.基因数据无损压缩集成电路,其特征在于,运用了如权利要求1所述的基因数据无损压缩方法,其结构包括:字段分离器、算子池、算子选择器、算子组合器和字段合并器;
字段分离器:用于将输入的基因数据分割为若干数据字段;
算子池:用于存储多种类型的压缩算子;
算子选择器:用于接收各数据字段和对应各个字段的实际压缩需求,并根据各数据字段的数据特点以及实际压缩需求从算子池选择压缩算子;
算子组合器:将选择的压缩算子组合为压缩算法;
字段合并器:将各数据字段根据对应组合好的压缩算法进行压缩处理,并将各数据字段的压缩结果进行合并。
3.基因数据无损压缩设备,其特征在于,包括基因数据无损压缩集成电路、存储器和内存控制器,所述内存控制器获取实际压缩需求,并将存储在存储器中的基因数据,均输入到基因数据无损压缩集成电路中,获取根据权利要求2所述的集成电路所得到的压缩合并文件,并存储到存储器中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科计算技术西部研究院,未经中科计算技术西部研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110632382.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置