[发明专利]一种基于聚类分析的客户细分方法及装置在审

专利信息
申请号: 201810496620.7 申请日: 2018-05-22
公开(公告)号: CN108734217A 公开(公告)日: 2018-11-02
发明(设计)人: 王新刚;王琳琳;孙涛;姜雪松;耿玉水;鲁芹;李爱民 申请(专利权)人: 齐鲁工业大学
主分类号: G06K9/62 分类号: G06K9/62;G06Q30/02
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 杨哲
地址: 250353 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据样本 自动编码器 聚类分析 平均距离 样本点 客户 样本 预处理 初始聚类中心 加权欧式距离 欧几里得距离 原始数据集 变异系数 遍历数据 公式计算 降序排序 客户信息 属性特征 特征提取 数值化 聚类 权重 加权 查找 统计
【权利要求书】:

1.一种基于聚类分析的客户细分方法,其特征在于,该方法包括:

获取客户信息原始数据集,进行数值化预处理,得到数据样本,通过自动编码器对数据样本进行降维和特征提取;

将自动编码器处理后的数据样本采用变异系数法计算属性特征的权重,并采用加权的欧几里得距离公式计算样本点间的距离;

计算所有数据样本间的平均距离,遍历数据样本查找每个样本点与其距离小于平均距离的近邻点,统计所有样本近邻点数量并按照降序排序,确定初始聚类中心点,将其余的数据根据加权的欧式聚类进行聚类,完成客户细分工作。

2.如权利要求1所述的方法,其特征在于,在本方法中,进行数值化预处理的具体步骤包括:

将非数值型的数据进行数值化处理;

使用标准化公式处理数值型的数据;

使用归一化处理公式对经标准化处理的数据进行处理,得到数据样本。

3.如权利要求1所述的方法,其特征在于,所述通过自动编码器对数据样本进行降维和特征提取的具体步骤包括:

将无标签的原始数据样本输入到自动编码器中的编码器上进行压缩编码,得到code编码;

采用自动编码器中的解码器对code进行解码操作,得到新数据样本;

计算新数据样本和原始数据样本的误差,根据误差调整动编码器中的编码器和解码器的权重参数,通过调整参数后的自动编码器对数据样本进行降维和特征提取。

4.如权利要求1所述的方法,其特征在于,在本方法中,改进的k-meams算法包括:

将自动编码器处理后的数据样本采用变异系数法计算属性特征的权重,并采用加权的欧几里得距离公式计算样本间的距离,计算所有数据样本间的平均距离;

遍历数据样本查找每个样本点与其距离小于平均距离的近邻点,统计所有样本近邻点数量并按照降序排序,确定初始聚类中心点。

5.如权利要求4所述的方法,其特征在于,在改进的k-meams算法中将自动编码器处理后的数据样本采用变异系数法计算属性特征的权重,具体步骤包括:

获取自动编码器处理后的数据样本的属性值矩阵;

计算属性值矩阵中各维属性的变异系数;

利用求得的各维属性的变异系数计算其各属性特征的权重。

6.如权利要求4所述的方法,其特征在于,在改进的k-meams算法中,所述各维属性的变异系数根据性值矩阵中各维属性值的标准差与平均数计算。

7.如权利要求4所述的方法,其特征在于,在改进的k-meams算法中,所述采用加权的欧几里得距离公式计算样本点间的距离的具体步骤包括:

根据计算得到的各维属性的权重,给欧式距离进行赋值加权;

采用加权的欧式距离公式计算数据样本点间的距离。

8.如权利要求4所述的方法,其特征在于,在改进的k-meams算法中,所述确定初始聚类中心点的具体步骤包括:

任选一数据样本点,查找与其距离小于平均距离的所有样本点,作为该数据样本点的近邻点,并计算近邻点的数量;

遍历数据样本查找每个样本点与其距离小于平均距离的近邻点,统计所有样本近邻点数量并按照降序排序;

选择近邻点数目最高的样本点作为第一个初始聚类中心点,若样本点为初始聚类中心点的近邻点则忽略,以此类推遍历所有样本点直至确定k个初始聚类中心点。

9.一种计算机可读存储介质,其中存储有多条指令,其特征在于,所述指令适于由终端设备的处理器加载并执行根据权利要求1-8中任一项所述的方法。

10.一种终端设备,包括处理器和计算机可读存储介质,处理器用于实现各指令;计算机可读存储介质用于存储多条指令,其特征在于,所述指令用于执行根据权利要求1-8中任一项所述的方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810496620.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top