[发明专利]用于基于人工智能的测序的训练数据生成在审
| 申请号: | 202080003622.3 | 申请日: | 2020-03-21 |
| 公开(公告)号: | CN112313666A | 公开(公告)日: | 2021-02-02 |
| 发明(设计)人: | A·杜塔;D·卡什夫哈吉;A·起亚 | 申请(专利权)人: | 因美纳有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08;G16B40/10;G16B40/20;C12Q1/6869 |
| 代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 基于 人工智能 训练 数据 生成 | ||
1.一种生成基准真值训练数据以训练用于簇元数据确定任务的基于神经网络的模板生成器的计算机实现的方法,所述方法包括:
访问在测序运行期间生成的一系列图像集,所述一系列图像集中的每个图像集是在所述测序运行的相应测序循环期间生成的,所述一系列图像集中的每个图像描绘簇及其周围背景,所述一系列图像集中的每个图像具有在像素域中的像素,并且所述像素中的每个像素被划分成子像素域中的多个子像素;
从碱基检出器获得将所述子像素中的每个子像素分类为四种碱基(A、C、T和G)中的一种的碱基检出,从而在所述测序运行的多个测序循环中针对所述子像素中的每个子像素产生碱基检出序列;
生成簇映射图,所述簇映射图将所述簇识别为共享基本上匹配的碱基检出序列的邻接子像素的不相交区域;
基于所述簇映射图中的所述不相交区域来确定簇元数据,
其中所述簇元数据包括簇中心、簇形状、簇尺寸、簇背景和/或簇边界;以及
使用所述簇元数据来生成基准真值训练数据,以用于训练用于所述簇元数据确定任务的基于神经网络的模板生成器,
其中所述基准真值训练数据包括衰减映射图、三元映射图或二元映射图,
其中训练所述基于神经网络的模板生成器以基于所述基准真值训练数据来产生所述衰减映射图、所述三元映射图或所述二元映射图作为输出,并且
其中,在推断期间执行所述簇元数据确定任务时,所述簇元数据继而根据由所训练的基于神经网络的模板生成器产生作为所述输出的所述衰减映射图、所述三元映射图或所述二元映射图来确定。
2.根据权利要求1所述的计算机实现的方法,所述方法还包括:
将从由所述基于神经网络的模板生成器产生作为所述输出的所述衰减映射图、所述三元映射图或所述二元映射图导出的所述簇元数据用于由基于神经网络的碱基检出器进行碱基检出,以便增加高通量核酸测序技术中的通量。
3.根据权利要求1至2中任一项所述的计算机实现的方法,所述方法还包括:
通过将不属于所述不相交区域中的任一个不相交区域的那些子像素识别为背景来生成所述簇映射图。
4.根据权利要求1至3中任一项所述的计算机实现的方法,其中所述簇映射图识别两个邻接子像素之间的簇边界部分,所述两个邻接子像素的碱基检出序列基本上不匹配。
5.根据权利要求1至4中任一项所述的计算机实现的方法,其中基于以下项来生成所述簇映射图:
在由所述碱基检出器确定的所述簇的初始中心坐标处识别原点子像素;以及
通过以所述原点子像素开始并以连续邻接的非原点子像素继续,对基本上匹配的碱基检出序列进行广度优先搜索。
6.根据权利要求1至5中任一项所述的计算机实现的方法,所述方法还包括:
通过将所述簇映射图的所述不相交区域的质心计算为形成所述不相交区域的相应邻接子像素的坐标的平均值来确定所述簇的超定位中心坐标;以及
将所述簇的所述超定位中心坐标存储在所述存储器中,以用作用于训练所述基于神经网络的模板生成器的所述基准真值训练数据。
7.根据权利要求6所述的计算机实现的方法,所述方法还包括:
在所述簇的所述超定位中心坐标处识别所述簇映射图的所述不相交区域中的质心子像素;
使用插值法对所述簇映射图进行上采样,并且将所上采样的簇映射图存储在所述存储器中,以用作用于训练所述基于神经网络的模板生成器的所述基准真值训练数据;以及
在所上采样的簇映射图中,基于衰减因子将值分配给所述不相交区域中的每个邻接子像素,所述衰减因子与邻接子像素距所述邻接子像素所属的不相交区域中的质心子像素的距离成比例。
8.根据权利要求7所述的计算机实现的方法,所述方法还包括:
从所上采样的簇映射图生成所述衰减映射图,所述衰减映射图基于所述邻接子像素的分配值来表达所述不相交区域中的所述邻接子像素和被识别为所述背景的所述子像素;以及
将所述衰减映射图存储在所述存储器中,以用作用于训练所述基于神经网络的模板生成器的所述基准真值训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于因美纳有限公司,未经因美纳有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080003622.3/1.html,转载请声明来源钻瓜专利网。





