[发明专利]区间集数据类型下基于不确定性度量的属性约简算法在审
| 申请号: | 202110471932.4 | 申请日: | 2021-04-29 | 
| 公开(公告)号: | CN113052268A | 公开(公告)日: | 2021-06-29 | 
| 发明(设计)人: | 唐振民;张倚萌;贾修一 | 申请(专利权)人: | 南京理工大学 | 
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 | 
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 | 
| 地址: | 210094 江苏省南京*** | 国省代码: | 江苏;32 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 区间 集数 类型 基于 不确定性 度量 属性 算法 | ||
本发明公开了一种区间集数据类型下基于不确定性度量的属性约简算法,包括以下步骤:(1)输入区间集数据,建立区间集型数据表下的粗糙集模型;(2)在区间集数据表的粗糙集模型下建立不确定性度量准则;(3)通过不确定性度量准则,计算全体条件属性的不确定性、区间集数据表的核属性和每个条件属性的属性重要度;(4)依次选择属性重要度最大的属性与核属性作为约简候选属性;(5)从约简候选属性中删除部分添加的冗余属性即可得到约简后的属性结合。本发明算法首次应用在区间集型数据表中,利用条件信息熵等准则构建一种不确定性度量作为度量指标的约简方法,约简后的数据比原本的数据有更低的维度,降低了数据量,提升了分类精度。
技术领域
本发明涉及数据处理,特别涉及一种区间集数据类型下基于不确定性度量的属性约简算法。
背景技术
粗糙集理论作为一种处理不确定和模糊信息的有效数学工具,已经成功地被应用到数据分析、数据挖掘、知识获取和聚类分析等众多研究领域。在经典的粗糙集模型中,数据是以信息系统的形式存在的。一般情况下,信息系统中每个对象在属性集合上的值都是唯一的、完备的。然而在实际获取数据的过程中,由于获取方式的不同或不当导致数据缺失、数据错误以及数据本身并不完整等,很难直接得到完备的信息系统,因此普通的单值型信息系统不再适合表示这种类型的数据。为了更有效地表示这一类数据,本文采用区间集作为对象的属性值,构造了区间集信息系统。相对于单值型的表示方式,这种模糊的表示方式能更完整、更有效地保存原有的信息。
随着科技的进步和发展,人们获取的数据不仅对象的个数庞大,而且描述对象的属性个数也在不停地增加。这些大规模的数据严重影响了数据的处理效率,消耗了更多的时间和空间。这就要求我们对庞大的数据进行降维处理。通常情况下,降维的方法可以分为属性约简和特征抽取。属性约简的本质就是找到一组最小的属性集合来保持原有属性全集的某种性质不变。属性约简能够提高数据处理的效率,对数据挖掘起到积极的作用。通过属性约简,能够有效地降低问题的复杂度,提高分类学习算法的预测精度和可解释性。与特征抽取相比,属性约简方法不改变属性值本身,仅利用一定的评价函数从原本全集属性空间获取一组最佳的属性子集,从而降低属性空间的维数。
属性约简从提出到现在已经有了近三十年的发展,目前国内外学者对数据表的属性约简算法有了诸多的研究和改进。例如,Pawlak最早提出了在普通数据表下基于正域不变的属性约简算法。该算法采用粗糙集理论中的正域的大小作为约简的评价标准,旨在对约简前后的数据表的分类能力保持一致。该方法简单,计算复杂度较低,但很难提高约简后数据表的分类正确率,约简的长度不稳定。(Pawlak Z.Rough sets[J].InternationalJournal of Computer and Information Sciences,1982,11(5):341–356.)
考虑到数据表中属性值的缺失,普通的属性约简方法不能应用在不完备数据表中。Dai等人将条件决策熵扩展到不完备数据表中,并根据三种不同的策略设计了三种属性约简算法。该算法为我们提供了解决不完备数据表属性约简问题的思路,为不同类型的数据表的约简问题奠定了基础。(Jianhua Dai,Wentao Wang,Haowei Tian,et al.Attributeselection based on a new conditional entropy for incomplete decision systems[J].Knowledge Based Systems,2013,39:207–213.)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110471932.4/2.html,转载请声明来源钻瓜专利网。





