[发明专利]一种信息编码方法、信息编码系统及相关装置在审
| 申请号: | 202111136309.X | 申请日: | 2021-09-27 |
| 公开(公告)号: | CN113890737A | 公开(公告)日: | 2022-01-04 |
| 发明(设计)人: | 刘凯;任玉彬;张洪杰 | 申请(专利权)人: | 清华大学 |
| 主分类号: | H04L9/22 | 分类号: | H04L9/22;H04L1/00;G06F7/58 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 高勇 |
| 地址: | 10008*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 信息 编码 方法 系统 相关 装置 | ||
本申请提供一种信息编码方法、信息编码系统及相关装置,涉及数据处理领域,通过配置高可靠性、高密度氨基酸编码原型系统RAHRSR,在RAHRSR系统中集成了编码符号水平压缩、纠删与纠错、消除局部重复氨基酸子序列、氨基酸可逆伪随机加密,适合大规模数据的可靠、高密度氨基酸伪随机加密编码,实现了文本、图片与音频文件的基于秘钥的伪随机化氨基酸加密编码,弥补了实用多肽算法的空白。本申请还提供一种信息编码系统、计算机可读存储介质和电子设备,具有上述有益效果。
技术领域
本申请涉及数据处理领域,特别涉及一种信息编码方法、信息编码系统及相关装置。
背景技术
传统数据存储介质容量饱和催生了生物大分子数据存储。在合成高分子链中单体序列可控性开辟了序列化生物大分子数据存储的前景。鉴于DNA合成与测序技术在过去五十年中所取得进展,4进制DNA数据存储已取得一定的进展。蛋白作为存储介质的研究主要集中在天然光转换和关开关荧光蛋白,蛋白的特定状态(bright state and the darkstate)代表二进制0或1。而16进制序列化镜像氨基酸编码效率是4bits/aa(4bits/aminoacid),高于光转换编码效率1bits/aa,高于DNA编码效率2bits/base.此外,单体聚合物的可控合成和质谱测序的革新为序列化多肽数据存储的存储奠定了基础。此外,将目前最优的固相多肽合成(SPPS)与基于质谱的从头测序技术直接应用于多肽数据存储仍然存在诸多不适配特征需要通过编码算法的合理设计加以克服。
发明内容
本申请的目的是提供一种信息编码方法、信息编码系统、计算机可读存储介质和电子设备,能够基于伪随机化多肽实现可靠的信息编码。
为解决上述技术问题,本申请提供一种信息编码方法,具体技术方案如下:
获取二进制数据;
将所述二进制数据分割为包含若干源符号的源块,并利用预设编码算法对所述源块进行编码,得到编码符号;
利用算术编码器处理所述编码符号,得到算术码字;
利用预设哈夫曼和旋转编码器将所述算术码字映射为氨基酸序列;
根据所述源块的第一数量和所述源符号的第二数量,并结合自动索引生成算法生成无均聚物的复合索引,并采用第一预设算法处理所述氨基酸序列,生成包含所述复合索引的中间氨基酸序列;所述中间氨基酸序列呈可逆伪随机分布;
在伽罗华域中计算生成多项式,然后将信息多项式与所述生成多项式相乘得到RS码字多项式,将所述RS码字多项式中系数对应的RS编码符号映射为目标氨基酸序列;所述信息多项式由所述中间氨基酸序列经过进制转换得到。
可选的,还包括:
为所述源块添加纠删冗余修复符号,所述纠删冗余修复符号用于恢复多肽链的缺失或缺损;其中,编码后的单独源块中所包含编码符号的个数等于源块中源符号的个数与修复符号的个数之和。
可选的,所述旋转编码器为采用15元哈夫曼和旋转级联码的旋转编码器,所述旋转级联码采用单符号前置约束旋转映射。
可选的,结合自动索引生成算法生成无均聚物的复合索引包括:
将源块数目与源块中所包含源符号的个数作为所述自动索引生成算法的输入,生成无均聚物的一级源块索引与二级源符号索引。
可选的,所述第一预设算法为基于密钥的Fisher-Yates洗牌算法,用于实现所述编码符号中氨基酸的可逆伪随机分布,并对所述编码符号进行数据加密。
可选的,在伽罗华域中计算生成多项式时,还包括:
通过第二预设算法生成校验冗余,所述校验冗余用于校正多肽的氨基酸替换和错位。
可选的,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111136309.X/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





