[发明专利]一种基于粗糙集的数据挖掘算法无效
申请号: | 201310054842.0 | 申请日: | 2013-01-30 |
公开(公告)号: | CN103150354A | 公开(公告)日: | 2013-06-12 |
发明(设计)人: | 王少夫 | 申请(专利权)人: | 王少夫 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 233100*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 粗糙 数据 挖掘 算法 | ||
技术领域
本发明一种基于粗糙集的数据挖掘方法。属于计算机信息技术领域。
技术背景
随着现代的通信技术的发展,越来越多的数据被收集和整合在一起,建立一个大的社会网络成为可能。例如,可以通过电子邮件的日志来建立使用者之间的联系网络,或者通过网络日志及网络通讯录等方式将用户提交的联系人信息建立社会网络。所以,现在的社会网络规模比早期网络庞大,通常包含几千或者几万的结点,甚至有多达百万个结点的网络。面对这样庞大复杂的网络,简单的数学知识和原始的人工处理已经不可能进行有效的分析。数据挖掘是从巨量数据中发现有效的、新颖的、潜在有用的并且最终可理解的模式的非平凡过程。数据挖掘就是为了解决当今拥有大量数据,但缺乏有效分析手段的困境而出现的研究领域。目前,已经在包括生物信息学,自然语言处理等许多方面发挥了巨大的作用。
为了获得最佳的数据挖掘效果,将采用一定的算法,建立模型,一种针对异常点的数据挖掘的新算法。利用粗糙特征选择方法,采用相似知识粒度的距离度量,研究不确定信息,在减少数据特征的同时还保留其性能。然后再对给定的特征值对对象进行排序,以提高计算复杂性。
发明内容
本发明提出一种基于粗糙集的数据挖掘方法,该方法主要解决异常点的数据挖掘问题,保证获得最佳的数据挖掘效果。
为达到上述目的,本发明采取的技术方案为:首先是该方法首先是根据用粗糙特征选择方法,采用相似知识粒度的距离度量,研究不确定信息,在减少数据特征的同时还保留其性能。然后再对给定的特征值对对象进行排序,以提高计算复杂性。最后通过在淋巴数据集上进行了实验分析。结果表明,该数据挖掘算法可以把大部分异常点检测出来
本发明提出的技术方案具体步骤包括:
粗糙集是它把知识分类嵌套到集合内,并作为集合组成的一部分。根据传统的方法来判断一个对象a是否属于集合X,通常分成3种情况:(1)对象a可能属于也可能不属于集合X;(2)对象a肯定不属于集X;(3)对象a肯定属于集合X;下面给出其定义。
假定U为非空的有限集合,I为U中的一个等价类关系,则二元对K=(U,I)称之为集合U的一个近似空间。假设X为集合U的一个子集,x为集合U中的一个对象,所有与x不可区分的对象所组成的一个集合设为I(x),I(x)中的每个对象都与对象x有同样的特征属性。对于每个子集和一个等价关系I∈Ind(K),都可以定义两个子集。
集合X关于I的下近似如式1:
集合X关于II的上近似如式2:
I*(X)=Y{Y∈U/I|Y∩X≠∮}={x∈U|[x]I∩X≠多} (2)
集合X的边界区如式3:
BND(X)=I*(X)-I*(X) (3)
BND(X)为集合X的上近似与下近似之差。如果BND(X)是空集,则称XX关于I是清晰的(crisp);反之如果BND(X)不是空集,则称集合X为关于I的粗糙集(rough Set)。其集合结构如图1所示。
粗糙集理论把知识看作是对论域的划分,从而使知识具有了颗粒性。
假如K=(U,Y)是一个知识库,R∈Y为论域U上的不可区分关系,知识R∈Y的粒度,记为KG(R)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于王少夫,未经王少夫许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310054842.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置