[发明专利]基因组组装方法、装置、设备及存储介质有效
| 申请号: | 202210311761.3 | 申请日: | 2022-03-28 |
| 公开(公告)号: | CN114694755B | 公开(公告)日: | 2023-01-24 |
| 发明(设计)人: | 王莹;卢宇彤;陈志广 | 申请(专利权)人: | 中山大学 |
| 主分类号: | G16B30/20 | 分类号: | G16B30/20;G16B20/00 |
| 代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 薛福玲 |
| 地址: | 510275 *** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基因组 组装 方法 装置 设备 存储 介质 | ||
1.一种基因组组装方法,其特征在于,所述基因组组装方法包括:
获取基因短序列,以及确定第一分割值;
基于所述第一分割值,将所述基因短序列进行分割,得到各基因子序列;
基于预设分组并行正则采样排序算法,对各所述基因子序列进行全局排序,得到各排序基因子序列,其中,所述预设分组并行正则采样排序算法为基于预先分组后的各个进程并行对各所述基因子序列进行正则采样排序的算法;
基于各所述排序基因子序列,构建分布式基因图;
并行遍历所述分布式基因图,得到各连续基因序列,并对各所述连续基因序列进行填充组装,得到各目标连续基因序列;
确定第二分割值,若所述第二分割值大于或等于预设最大分割阈值,则将各所述目标连续基因序列进行组装,得到基因组组装结果;
其中,在所述确定第二分割值的步骤之后,所述基因组组装方法还包括:
若所述第二分割值小于所述预设最大分割阈值,则基于所述第二分割值,在所述目标连续基因序列提取各分割序列,并返回执行步骤:基于所述第二分割值,将所述基因短序列进行分割,得到各基因子序列,直至得到各个新的排序基因子序列;
将各所述分割序列和各所述新的排序基因子序列进行合并,得到各合并基因序列;
基于各所述合并基因序列,返回执行步骤:构建分布式基因图,以得到新的目标连续基因序列,直至确定的分割值大于所述预设最大分割阈值,将各所述新的目标连续基因序列进行组装,得到基因组组装结果。
2.如权利要求1所述的基因组组装方法,其特征在于,所述基于所述第一分割值,将所述基因短序列进行分割,得到各基因子序列的步骤包括:
将所述第一分割值加上预设最大分割阈值,得到分割窗口;
基于所述分割窗口,对所述基因短序列进行扫描分割,得到各所述基因子序列,其中,每一所述基因子序列的长度为分割窗口的长度。
3.如权利要求2所述的基因组组装方法,其特征在于,所述基于预设分组并行正则采样排序算法,将各所述基因子序列进行全局排序,得到各排序基因子序列的步骤包括:
分别对各所述基因子序列中前缀长度为所述第一分割值对应的前缀序列进行反转后按照字母表顺序进行排序,并基于排序结果,对各所述基因子序列进行排序,得到各初始排序序列;
获取进程的数量,并基于所述数量,将各所述进程进行分组,得到各进程组,其中,每一所述进程组中的各进程设置有对应的编号;
将每一所述初始排序序列作为一个待排序元素,并将各所述待排序元素分配至各所述进程中;
通过每一进程组中的各进程并行对各所述待排序元素进行正则采样排序,得到各排序基因子序列。
4.如权利要求3所述的基因组组装方法,其特征在于,所述通过每一进程组中的各进程并行对各所述待排序元素进行正则采样排序,得到各排序基因子序列的步骤包括:
针对每一所述进程中的各待排序元素,将各所述待排序元素进行排序,得到第一排序元素,并对所述第一排序元素进行正则采样,得到第一采样元素;
将各所述进程中的第一采样元素发送至对应进程组的第一编号进程,并针对每一进程组中的第一编号进程,并行对各所述第一采样元素进行排序以及正则采样,得到各所述进程组的组采样元素;
将各所述组采样元素发送至预设全局进程,并通过所述预设全局进程对各所述组采样元进行排序以及正则采样,得到全局采样元素;
基于所述全局采样元素,分别将各所述进程中的第一排序元素进行划分,得到各划分元素,并记录各所述划分元素对应的元素数量和位移;
将不同进程组之间编号相同的各进程组成一个新的通信子域;
针对每一所述通信子域中的各进程,基于各所述进程中各划分元素对应的元素数量和位移,将各个进程中的各划分元素进行数据交换,得到各所述进程中的目标元素;
将各个进程中的目标元素进行归并排序,得到第二排序元素;
并行将每一所述通信子域中各进程的第二排序元素进行正则采样排序,得到各所述排序基因子序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210311761.3/1.html,转载请声明来源钻瓜专利网。





