[发明专利]一种大数据样本的智能化模糊特征选择方法在审
| 申请号: | 201911080363.X | 申请日: | 2019-11-07 |
| 公开(公告)号: | CN110837864A | 公开(公告)日: | 2020-02-25 |
| 发明(设计)人: | 潘峰;陆璐 | 申请(专利权)人: | 华南理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
| 代理公司: | 重庆市信立达专利代理事务所(普通合伙) 50230 | 代理人: | 陈炳萍 |
| 地址: | 510006 广东省广州市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 样本 智能化 模糊 特征 选择 方法 | ||
1.一种大数据样本的智能化模糊特征选择方法,其特征在于,包括以下步骤:
S1:特征选择步骤转换为计算模糊特征选择向量W(W1,W2,W3…,Wi,…,Wn),其中每一个Wi取值在[0,1]区间,取0时表示第i项特征舍去,取1时表示第i项特征选择;
S2:针对每一个样本的特征Xi,换算公式添加取舍度向量Y(Y1,Y2,Y3,…,Yi,…,Yn),每个分量Yi∈[0,1];
S3:Wi与Yi对比,分为两个区间,在两个区间范围内分别选取Wi为0或为1;
S4:得到每个特征计算结果,进行每个特征的提取或舍去。
2.根据权利要求1所述的大数据样本的智能化模糊特征选择方法,其特征在于,所述S1过程中,还包括以下步骤:
D1:若干个向量W进行初始化;
D2:假定每个向量为粒子的位置属性;
D3:假定每个粒子均含有一个速度属性V(V1,V2,V3,…,Vi,…,Vn);
D4:根据粒子的位置属性和速度属性构建一个粒子群模型;
D5:粒子群模型中通过适度函数f(W)进行迭代位置和速度的过程;
D6:得到最佳粒子gbest。
3.根据权利要求2所述的大数据样本的智能化模糊特征选择方法,其特征在于,所述S2过程中Yi的计算方式包括以下步骤:
M1:加权欧式距离计算:
M2:粒子速度迭代公式:
M3:粒子位置迭代公式:
其中:d(xa,xb)表示数据xa和xb的加权欧式距离,xa和xb分别表示两条不同的样本,xa有n维特征属性,xai表示xa样本的第i个属性,xbi表示xb样本的第i个属性;λ为惯性因子,c1为对自身经验的偏好度,c2为对群体经验的偏好度,r1和r2是取值在(0,1)之间的随机数,为第t代某个离子速度的第i维分量,pbest为第t代粒子群中最好适应度粒子位置的第i维分量,gbest为全局最好适应度粒子位置的第i维分量。
4.根据权利要求1所述的大数据样本的智能化模糊特征选择方法,其特征在于,所述S3过程中,当Wi≤Yi,Wi取值0;当Wi>Yi,Wi取值1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911080363.X/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





