[发明专利]基于模糊聚类的凝胶蛋白分割方法在审
申请号: | 201611020929.6 | 申请日: | 2016-11-15 |
公开(公告)号: | CN106651838A | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 辛化梅;张明 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/194 |
代理公司: | 济南圣达知识产权代理有限公司37221 | 代理人: | 张勇 |
地址: | 250014 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模糊 凝胶 蛋白 分割 方法 | ||
技术领域
本发明涉及双向凝胶图像分析技术领域,尤其涉及基于模糊聚类的凝胶蛋白分割方法。
背景技术
在诸多蛋白质分离方法中,双向凝胶电泳(2-DE)技术广泛的应用在蛋白质组学中,主要是根据蛋白质等电点和分子量的差异,将复杂蛋白质混合物中的蛋白质在一块凝胶上以点状的形式分离。随后使用扫描设备对蛋白质凝胶进行扫描,得到数字化凝胶图像。在图像上蛋白质呈现出形状、大小和灰度各不相同的点,其中每一个点代表了一个特定的蛋白质。分割是图像分析的重要步骤,凝胶图像的研究需要从图像中提取出蛋白点,其主要的目标是找到蛋白点的位置和蛋白点周围的边界,确定它们的数量并分析蛋白质的不同状态。
模糊聚类应用于模式识别、图像处理、水质分析等领域。在一些具体的识别应用中,如语音识别中的分类和匹配,雷达目标识别中目标库的建立和新到目标的归类等方面取得了较好的效果;在图像处理中广泛的应用于图像分割,如纹理图像、医学图像以及航空遥感图像等分割方面,有效解决了图像目标区域边界模糊性,遥感图像中典型的混合像元等问题。
图像分割就是根据灰度、颜色、纹理和形状等特征,把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。凝胶蛋白图像分割的优点就是将图像分离成点和无点区域,以便更好的对蛋白质进行评估,现有的针对凝胶图像的分割方法有以下几种:
基于边缘检测的分割方法,通过检测不同区域的边缘来进行分割,对于边缘定位精度和边界的确定有很好的分割效果并且保留了图像重要的结构属性,但极易受到噪声和图像自身模糊程度的影响。
毕玉慧等人针对分水岭算法过分割的问题,提出了利用拓扑曲率与分水岭算法相结合的分割算法,该方法对于凝胶电泳图像更具针对性。
张彦清等提出的基于马尔科夫随机场的凝胶电泳图像分割算法,是根据贝叶斯定理实现图像的分割,该过程中通过了一个二阶逻辑模型(MLL)模糊聚类作为先验知识获取其先验概率并因此得到后验概率,并引入了灰度点密度权值来实现聚类和均值方差的改进更新。在一定程度上解决了微弱蛋白点和重叠蛋白点的检测和分割,进一步提高了凝胶图像分割的准确性。
Rashwan S等人在2010年在传统FCM算法的基础上,为了从不同的背景中分离出更多的蛋白点引入了模糊关系概念,该方法表现出较高的性能,对于相对较弱的暗斑点也能够有效的检测出来。
目前国内还没有形成对凝胶图像分割的深入研究,纵览国外的研究状况来看,各种方法都有利弊,所以我们要做的工作就是针对凝胶图像中蛋白点的特性,研究凝胶图像的分割算法,在保护图像信息和细节的同时,增强对微弱蛋白点和重叠蛋白点的识别与检测。
发明内容
本发明的目的就是为了解决上述问题,提供基于模糊聚类的凝胶蛋白分割方法,首先使用引导滤波器对图像进行滤波并增强图像对比度;然后通过模糊核C均值聚类算法对样本聚类,最后采用最大隶属度原则去模糊化,实现最优分割,在此过程中引入样本方差来计算高斯核函数径向宽度σ值,该方法具有更好的适应性和分割精度。
为了实现上述目的,本发明采用如下技术方案:
基于模糊聚类的凝胶蛋白分割方法,包括以下步骤:
步骤一:对图像进行预处理,利用引导滤波器对图像进行滤波并增强图像的对比度;
步骤二:初始化聚类类别数、加权指数、迭代终止阈值、最大迭代次数及初始聚类中心;
步骤三:计算核函数中的径向宽度值;
步骤四:更新隶属度矩阵和聚类中心;
步骤五:比较当前新的聚类中心与上一次聚类中心的绝对差值是否小于迭代终止阈值,或者迭代计数器的值是否大于最大迭代次数,若成立则停止并输出最终的隶属度矩阵和聚类中心,转到步骤六继续执行;否则,迭代计数器加一后转向步骤四继续执行;
步骤六:去模糊化,得到最优的分割结果。
所述步骤一中,运用形态学方法增强蛋白点与背景间的对比度。
所述步骤二中,从蛋白点样本数据集中任选c个不同数据分别作为初始聚类中心的c个初始聚类中心值,2≤c<n,n指聚类数据集中所有数据的个数。
所述步骤二中,聚类类别数和加权指数通过赋予不同的值,进行实验测试对比效果图获得。
所述步骤三中,通过计算蛋白点样本数据方差来确定高斯核函数径向宽度值。
径向宽度值的计算方法具体为:
其中,为蛋白点样本数据集的均值,σ为高斯核函数的径向宽度值;Σ为求和操作;n 指聚类数据集中所有数据的个数;xk指第k个样本点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611020929.6/2.html,转载请声明来源钻瓜专利网。