[发明专利]数据聚类方法及B2B平台客户偏好获取方法、装置有效
申请号: | 201510490962.4 | 申请日: | 2015-08-11 |
公开(公告)号: | CN105023041B | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 武忠;张丽媛;李媛;吕思杰;赵飞祥 | 申请(专利权)人: | 东南大学;无锡云歌电子商务有限公司 |
主分类号: | G06N3/00 | 分类号: | G06N3/00;G06Q30/02 |
代理公司: | 江苏永衡昭辉律师事务所32250 | 代理人: | 杨楠 |
地址: | 210096*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 方法 b2b 平台 客户 偏好 获取 装置 | ||
技术领域
本发明涉及数据挖掘技术领域,尤其涉及一种改进的LF蚁群聚类方法及其在电子商务技术领域的应用。
背景技术
第三方B2B电子商务平台竞争压力巨大,为保持现有的客户的忠诚度,并吸引更多的潜在客户是现在第三方B2B平台所面临的一大难题。并且相对于消费者市场,企业市场有其自身的特点。因此,获取客户偏好,提供个性化的服务是未来的发展方向,而通过数据挖掘,分析在线客户的偏好是平台个性化服务的起点。
数据挖掘是获取客户偏好的重要方法,而聚类则是数据挖掘中的重要内容,属于无监督学习的过程。聚类的基本原则是根据数据间的不同特征对数据集进行分簇,发现数据中隐含的模式,聚类结果是同一簇中的数据相似度尽量大,不同簇的数据相似度尽量小。
目前存在许多用于客户分析的经典聚类算法,其中近年来科学家根据蚂蚁群体智能所提出的蚁群聚类算法由于可以自动生成集群,不需要预先设定聚类中心,可以有效地发现数据中隐藏的共同特征,因此蚁群聚类算法在客户分析中已受到越来越多的重视。Deneubourg等[Deneubourg,J.L.Goss,S.Franks,N.Sendova-Franks.The dynamics of collective sorting:robot-like ants and ant-like robot s[C].Proceedings of the 1st International Conference on Simulation of Adaptive Behaviors,M IT Press,Cambridge,MA,pp.356-363,1991]最早把蚁群算法引入到聚类和分类问题中,提出了BM模型(basic model)用来解释蚂蚁堆积尸体形成墓穴的行为。Lumer和Faieta[Lumer E,Faieta B.Diversity and Adaptation in Populations of Clustering Ants[A].From Animals to Animates 3:Proceedings of Third International Conference on Simulation of Adaptive Behavior Cambridge[C].Cambridge,MA,USA:MIT Press,1994:501-508.]在BM模型的基础上,提出了用于数据聚类的LF算法。LF算法的思想是:初始时将待处理数据随机放在一个Z×Z的二维网格中,同样也产生一些虚拟的蚂蚁,这些蚂蚁能观察到S×S邻域中的数据对象,因此可以判断搬运对象是否与观察到的对象相似,对象xi在地点R处的相似度公式为:
相似度中的距离,一般采用欧式距离:
其中,m表示属性的个数,α为相似度系数。捡起、放下概率的公式分别为:
其中,k1、k2为阈值常量。通过计算相似度,蚂蚁不断拾起或放下对象,不断重复,直到达到设置的最大迭代次数。
传统的LF蚁群聚类算法中,相似度函数、捡起放下概率转换函数参数需要设置多个参数,蚂蚁观察半径不变且运动是随机的,最大迭代次数需要根据经验进行设置。
发明内容
本发明所要解决的技术问题在于克服现有技术不足,提供一种数据聚类方法,对现有LF蚁群聚类方法进行改进,在提高聚类效率的同时,提高聚类结果的准确性。
本发明具体采用以下技术方案解决上述技术问题:
数据聚类方法,利用LF蚁群聚类方法进行数据的聚类,所述LF蚁群聚类方法中,负载蚂蚁所负载的数据对象或空载蚂蚁所在网格单元的数据对象xi与该蚂蚁能观察到的数据对象之间的相似度f(xi)按照下式计算:
式中,NeighS×S(r)表示该蚂蚁所在网格单元r的大小为S×S的邻域;S为蚂蚁的观察半径;ni表示NeighS×S(r)中数据对象的总数;d(xi,xj)表示xi与NeighS×S(r)中的数据对象xj之间的欧氏距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学;无锡云歌电子商务有限公司,未经东南大学;无锡云歌电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510490962.4/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置