[发明专利]基于异常检测和半监督的超声关键帧自主识别方法有效
申请号: | 202110010282.3 | 申请日: | 2021-01-04 |
公开(公告)号: | CN112908465B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 黄庆华;习佳宁;李学龙 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G06V10/774 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 王鲜凯 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 异常 检测 监督 超声 关键 自主 识别 方法 | ||
1.一种基于异常检测和半监督的超声关键帧自主识别方法,其特征在于步骤如下:
步骤1,构建超声视频帧数据集:利用超声探头对人体不同组织区域进行视频帧采集,得到带位置坐标的超声视频数据集X=[x1,x2,...,xn],其中,xi表示第i个超声视频帧,i=1,2…,n,n为数据集包括的视频帧总数;所述的组织区域包括脖子、胸部、手臂、腹部、后背、腰部和大腿;
步骤2,变分自编码器对超声帧的正态编码向量提取:首先,根据无监督方式的变分自编码器VAE的框架,分别构建编码网络和解码网络,其中,编码网络由三层神经网络构成,其输入为超声视频帧xi,以及从m维的标准正态分布N(0,Im)随机采样的相应随机向量εi,Im为m维单位矩阵,m由用户预设的正整数,取值范围为[2000,10000],i∈[1,…,n],设编码网络的网络参数集合为φ;编码网络的输出为超声视频帧xi为所对应的编码向量zi,(μφ)i为编码向量zi的均值,维度为m×1,(Σφ)i为编码向量zi的协方差矩阵,维度为m×m,正态分布函数N((μφ)i,(Σφ)i)构成编码向量zi的后验概率函数qφ(zi|xi);解码网络也由三层神经网络构成,其输入为编码向量zi,输出为通过编码向量zi对超声视频帧xi进行重建的重建似然函数pθ(xi|zi),i∈[1,…,n],θ表示解码网络的网络参数集合;
然后,通过随机梯度下降法对下式进行优化,得到编码器网络和解码器网络参数φ和θ以及各超声视频帧的编码向量zi,i∈[1,…,n]:
其中,表示似然函数pθ(xi|zi)的对数关于后验概率函数qφ(zi|xi)=N((μφ)i,(Σφ)i)的期望值,DKL{qφ(zi|xi)||N(0,Im)}表示qφ(zi|xi)和N(0,Im)的KL散度;
步骤3,无监督离群点检测方式的超声关键帧预筛选:设定分位数α=0.05,对于数据集中的超声视频帧xi,i=1,2…,n,当其重建概率pi小于分位数α时,判定该视频帧为离群点,并将其作为候选关键帧;否则,判定该输入帧为平凡帧;
所述的重建概率pi按以下过程计算得到:从m维的标准正态分布N(0,Im)进行K次采样,得到超声视频帧xi的相应随机向量K在[1000,10000]内取值;将xi和作为输入,通过步骤2的编码网络,得到均值(μφ)i、协方差矩阵(Σφ)i和编码向量再将每个编码向量代入解码网络,计算出相应的重建似然函数得到所有K个重建概率;将这K个重建概率的均值,作为超声视频帧xi最终的重建概率,即
步骤4,标注约束相似图半监督学习视频帧低秩分解:首先,对于步骤3从n个超声视频帧中所筛选出的L个候选关键帧,从中随机选择l个帧进行标注,得到关系记录矩阵Cl×c,其中,lL,关系记录矩阵的第i行j列元素[Cl×c]i,j=1表示所选择的第i个候选关键帧属于第j类关键帧,[Cl×c]i,j=0表示所选择的第i个候选关键帧不属于第j类,i=1,2…,l,j=1,2…,c,前c-1个类为不同类型的关键帧类别,第c类为平凡帧类别;
然后,按下式构建用于描述半监督学习标注关系的标注约束矩阵Y:
其中,In-l表示(n-l)维单位矩阵;
接着,构建标注约束低秩分解的半监督学习优化函数如下:
其中,矩阵Z=[z1,z2,...,zn]为由n个超声视频帧通过步骤2得到的编码向量所构成的编码向量矩阵,维度为m×n,矩阵U为从原始m维编码向量特征到k维低秩特征的线性映射矩阵,维度为m×k;矩阵V为潜变量矩阵,其中,vi为k维的非负向量,向量vi中元素的初始值为(0,1)区间内等概率随机产生,i=1,2…,c+(n-l),k是由用户预设的正整数,在[100,2000]内取值;W为n×n维的相似性矩阵,其对角线元素取值均设置为1,非对角线元素wij为第i个编码向量zi和第j个编码向量zj的热核函数权重,按照wij=exp{-||zi-zj||2/σ}计算得到,σ为扩散系数,由用户设定,取值范围为(0,+∞);D为度矩阵,是以相似性矩阵W的每行之和分别作为对角线元素的对角矩阵;λ是相似性正则化项的调谐参数,取值由用户设定,取值范围为(0,+∞);β是线性映射矩阵正则化项的调谐参数,取值由用户设定,取值范围为(0,+∞);
采用交替方向乘子法求解上述半监督学习优化函数,得到矩阵U和V;
步骤5,视频帧编码向量低秩伪逆的关键帧自主识别:对于新获取的超声视频帧xn+1,按照下式得到其预测向量
其中,zn+1为按照步骤2方法获得的该视频帧的编码向量;
记录预测向量中最大元素值的位置序号in+1,再记录步骤4所得的标注约束矩阵Y中第in+1行中元素值为1的列序号jn+1;若jn+1属于[1,c-1]之内,则将超声视频帧xn+1视为第jn+1类关键帧;若jn+1=c,则将超声视频帧xn+1视为平凡帧。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110010282.3/1.html,转载请声明来源钻瓜专利网。