[发明专利]DNA信道仿真与编码优化方法及装置在审
申请号: | 202111307148.6 | 申请日: | 2021-11-05 |
公开(公告)号: | CN114023374A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 汪小我;袁乐康;王也 | 申请(专利权)人: | 清华大学 |
主分类号: | G16B5/00 | 分类号: | G16B5/00;G16B20/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张娜 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | dna 信道 仿真 编码 优化 方法 装置 | ||
本申请涉及信息存储技术领域,特别涉及一种DNA信道仿真与编码优化方法及装置,其中,方法包括:基于给定的储存环节和参数,建立针对储存条件的信道仿真模型;将编码后的DNA序列输入信道仿真模型,得到仿真测序结果,并由仿真测序结果确定解码情况;由仿真测序结果及对应的解码情况统计分析得到编码优化数据,并利用编码优化数据优化信道编码设计和信道参数设计。本申请实施例允许用户快速搭建DNA信道模型,以极低的实验成本验证特定编码方案的可行性,并通过系统性调整方法获取针对特定信道的最优冗余设计,有助减少解码失败、储存空间浪费等问题发生的可能性。
技术领域
本申请涉及信息存储技术领域,特别涉及一种DNA(Deoxyribo Nucleic Acid,脱氧核糖核苷酸)信道仿真与编码优化方法及装置。
背景技术
在数据爆炸的时代下,传统的信息储存方式难以满足快速增长的数据储存需求:地球上每年产生的信息量呈指数增长的趋势,预计到2040年,全球将需要一百万吨的硅基芯片才能储存当年产生的数据。作为储存生物遗传信息的分子,DNA具有用于信息储存的诸多优势:储存密度大、能耗低、储存周期长等,特别是储存密度可达到1019bit/cm3,理论上只需要一公斤DNA即可储存目前的全球信息总量,是一种极具吸引力的信息储存介质。
DNA的由含四种不同碱基(A,T,G,C)的脱氧核苷酸组成,理论上一个核苷酸位点可以储存两个比特的数据。在实际操作中,需要储存的数据被编码到多条DNA链中,通过DNA合成仪合成承载信息的DNA,经取样、PCR扩增等系列步骤后,通过DNA测序仪测序读出,解码恢复储存的数据。由于这一信道并非完美,各种错误可能在储存过程中被引入,包括碱基的替换、丢失、增加等链内错误和整链丢失。为从含有错误的测序信息中完美恢复储存数据,需要使用合适的纠错码,通过在编码时增加一定量的冗余来对抗信道中的噪声。
相关技术中,学界提出将RS码、喷泉码、LDPC码等编码用于DNA编码的解决方案,但如何设计适合DNA储存的编码方式、如何系统确定合适的冗余量是该领域的一个技术难点。然而,根据香农编码理论,寻找最优的编码方式和冗余量,必须以合适的方式引入冗余以对抗特定信道特殊的噪声结构,但是目前技术条件下开展DNA储存实验仍存在价格昂贵、实验周期长的限制,难以通过反复实验来迭代优化编码设计。
因此,面向DNA信息存储的编码设计仍缺少快速、低成本的验证方式,以及系统的调整优化方法,亟待解决。
申请内容
本申请提供一种DNA信道仿真与编码优化方法及装置,以解决了面向DNA信息存储的编码设计仍缺少快速、低成本的验证方式,以及系统的调整优化方法的问题。
本申请第一方面实施例提供一种DNA信道仿真与编码优化方法,包括以下步骤:基于给定的储存环节和参数,建立针对储存条件的信道仿真模型;将编码后的DNA序列输入所述信道仿真模型,得到仿真测序结果,并由所述仿真测序结果确定解码情况;由所述仿真测序结果及对应的解码情况统计分析得到编码优化数据,并利用所述编码优化数据优化所述信道编码设计和信道参数设计。
可选地,在本申请的一个实施例中,所述将编码后的数据输入所述信道仿真模型,得到仿真测序结果,包括:将所述编码后的DNA序列输入至所述信道仿真模型,得到测序序列和各中间阶段的序列存在状态;根据所述测序序列和所述各中间阶段的序列存在状态获取所述仿真测序结果。
可选地,在本申请的一个实施例中,在得到所述仿真测序结果之后,还包括:基于所述仿真测序结果提取信道错误特征,并利用所述信道错误特征分析调整所述编码优化数据,得到最佳编码优化数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111307148.6/2.html,转载请声明来源钻瓜专利网。