[发明专利]一种基于容错的基因选择方法与装置有效

专利信息
申请号: 201910453064.X 申请日: 2019-05-28
公开(公告)号: CN110210552B 公开(公告)日: 2023-03-24
发明(设计)人: 孙林;曹玉洁;李晨阳;宁远翔;王蓝莹;秦小营;殷腾宇;赵婧;王欣雅;张玖肖 申请(专利权)人: 河南师范大学
主分类号: G06F18/2411 分类号: G06F18/2411;G06N3/006
代理公司: 郑州睿信知识产权代理有限公司 41119 代理人: 吴敏
地址: 453007 *** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 容错 基因 选择 方法 装置
【说明书】:

发明涉及一种基于容错的基因选择方法与装置,属于数据处理技术领域,方法包括利用基于容错的邻域粗糙集算法和离散粒子群优化算法对基因数据集进行约简,得到最优基因子集。在约简过程中,引入基于容错的依赖度来评估决策属性集对条件属性集的依赖性,从而提出基于容错的依赖度和邻域粒度混合度量方法,并构造离散粒子群优化算法中的适应度函数,即含有基于容错的依赖度的粒子适应度函数。本发明的基因选择方法分别从依赖度和邻域粒度两个不同的视角对属性集进行评估,解决了邻域粗糙集的零容错问题,并引导粒子快速搜索最优基因子集,使得到的最优基因子集的分类精度较高。

技术领域

本发明属于数据处理技术领域,具体涉及一种基于容错的基因选择方法与装置。

背景技术

现有技术中,Wang Changzhong等人在2016年的期刊《Knowledge-Based Systems》第111卷173-179页上发表的《Feature subset selection based on fuzzy neighborhoodrough sets》中,将邻域粗糙集与模糊粗糙集结合,提出了模糊邻域粗糙集模型,并根据依赖度度量构造出了相应的属性约简算法。徐风等人在2017年的期刊《南京大学学报》第53卷926-936页上发表的《基于模糊邻域粗糙集的信息系统不确定性度量方法》,证明了模糊邻域粗糙集模型对信息系统具有更好的不确定性度量效果。因此,为了解决以传统启发式函数对评估属性的方法过于单一的问题,任晓霞等在2018年的期刊《计算机工程与应用》第9期发表的《基于模糊邻域粗糙集的启发式属性约简算法》中重新定义了依赖度,从近似逼近和知识粒度两个方面对属性重要度进行评估,从而提高属性约简子集的分类精度。然而,该约简算法并未考虑邻域粗糙集在属性约简过程中的零容错问题,使得到的基因子集的分类精度较低。

张哲等人在2016年的期刊《计算机工程》第42卷188-196页上发表了《基于离散粒子群优化和邻域约简的基因特征选择算法》,该算法结合邻域粗糙集模型中决策属性在条件属性子集上的分类能力与离散粒子群优化算法较好的全局搜索能力和收敛快的特点,以避免算法陷入局部最优。但是该算法并未考虑到邻域粗糙集在基因选择过程中的零容错问题,导致得到的基因子集的分类精度较低。

以上零容错问题出现的原因在于:在经典的邻域粗糙集中,图2中的4个标注对象:空心圆和实心圆分别表示对象的两种类别,用DW表示“空心圆”等价类,DB表示“实心圆”等价类,虚线圆圈表示某个对象的δ(xi)邻域。由图2可知/即x1,x4∈POSB(D),/这种情况被认为:当前属性集B没有成功将对象x2和x3进行正确地分类,需要增加新的属性进行进一步判别。但是,在δ(x2)有10个对象,其中有一个和其他对象的类别不同,δ(x3)有10个对象,其中有9个对象的类别相同,仅有1个对象的类别和它们不同,这说明在数据集存在中噪声数据的情况下,当前属性集B已经可以很好的将对象x2和x3进行分类,此时若再增加属性,则增加的属性对当前属性集B的分类能力的贡献是无法准确判定的,这个属性不一定是重要属性,可能只是一般属性,甚至是冗余属性。这种对于噪声数据的零容错性,可以表示为:

其中,当样本xi的邻域中所有的样本所属类别与样本xi的类别相同,则该样本xi属于正域,即Pr(X|δ(xi))=1。当样本xi的邻域中存在样本x的所属类别与样本xi的类别不相同,则该样本xi不属于正域,即Pr(X|δ(xi))=0。这种零容错现象会导致部分可以对样本很好分类的属性被筛选掉,使得基因选择后的分类结果降低。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南师范大学,未经河南师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910453064.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top