[发明专利]一种k-近邻关系下的空间高效用核模式挖掘方法在审
| 申请号: | 202011519782.1 | 申请日: | 2020-12-21 |
| 公开(公告)号: | CN112667703A | 公开(公告)日: | 2021-04-16 |
| 发明(设计)人: | 王丽珍;罗金;周丽华;陈红梅;肖清 | 申请(专利权)人: | 云南大学 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62 |
| 代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 罗江 |
| 地址: | 650000*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 近邻 关系 空间 效用 模式 挖掘 方法 | ||
1.一种k-近邻关系下的空间高效用核模式挖掘方法,其特征在于:所述挖掘方法包括:
对一个核元素f,基于网格方法计算核元素的每个实例ij的k-近邻实例集k-NI(ij);
根据第三定义和第四定义求出核元素f的k-近邻特征集k-NF(f),并通过顺序树的方法收集所有的候选核模式{f,P};
计算二阶候选核模式{f,P}的效用度,并将候选模式{f,P}中满足第二剪枝条件和第三剪枝条件的核模式进行剪枝;
计算三阶以上候选模式{f,P}的参与实例集和模式效用度,并将候选模式{f,P}中满足第一剪枝条件和第四剪枝条件的核模式进行剪枝;
输出经过剪枝的高效用的核模式集CP。
2.根据权利要求1所述的一种k-近邻关系下的空间高效用核模式挖掘方法,其特征在于:所述通过顺序树的方法收集所有的候选核模式{f,P}包括:顺序树建立步骤和候选核模式收集步骤;所述顺序树建立步骤包括:
假设A的k-近邻特征集k-NF(A)={C,D,B,E},将其按照字典顺序排序为{B,C,D,E},以核元素A为根节点,k-NF(A)按照字典顺序作为A的孩子结点,接着将第二层结点依次作为当前核元素,以它字典排序后的特征作为孩子结点循环进而得到顺序树结构。
3.根据权利要求2所述的一种k-近邻关系下的空间高效用核模式挖掘方法,其特征在于:所述候选核模式收集步骤包括:
层次遍历,从根结点A依次向下层次遍历每个结点并进行组合,到第二层形成二阶候选,到第三层形成三阶候选并逐层进行直到完成最后一层的候选,进而收集到的所有候选核模式。
4.根据权利要求1所述的一种k-近邻关系下的空间高效用核模式挖掘方法,其特征在于:所述第一剪枝条件包括:
给定m阶的核模式{f,P},若它的所有参与实例集为空,则{f,P}以及它的所有超集{f,P'}一定不是高效用核模式,则需要剪枝。
5.根据权利要求1所述的一种k-近邻关系下的空间高效用核模式挖掘方法,其特征在于:所述第二剪枝条件包括:
给定核模式{f,P}(|P|1),当P中所有特征在对应二阶核模式中的特征效用参与率FUPR都小于效用度阈值ε时,{f,P}一定不是一个高效用核模式,则需要剪枝。
6.根据权利要求1所述的一种k-近邻关系下的空间高效用核模式挖掘方法,其特征在于:所述第三剪枝条件包括:
给定核模式{f,P}(|P|1),当P中所有特征在对应二阶核模式中的特征效用参与率的平均效用参与率ε时,{f,P}一定不是高效用核模式,则需要剪枝。
7.根据权利要求1所述的一种k-近邻关系下的空间高效用核模式挖掘方法,其特征在于:所述第四剪枝条件包括:
给定m(m1)阶的核模式{f,P},如果它的模式效用度CPUI({f,P})ε,则对{f,P}的超模式{f,P'}求差集得到的特征集取F'中所有特征fi在二阶核模式{f,fi}中的特征效用参与率的平均值与{f,P}的模式效用度求平均,即则超模式{f,P'}一定不是高效用核模式,则需要剪枝。
8.根据权利要求1所述的一种k-近邻关系下的空间高效用核模式挖掘方法,其特征在于:所述第三定义包括:空间实例的k-近邻特征集k-NF(ij),给定一个空间实例ij,则ij的k-近邻特征集是k-NI(ij)中的实例所属的特征集合,定义为
所述第四定义包括:空间特征的k-近邻特征集k-NF(fi),给定一个空间特征fi,fi的k-近邻特征集等于该特征所有实例的k-近邻特征集k-NF(ij)的并集,定义为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011519782.1/1.html,转载请声明来源钻瓜专利网。





