[发明专利]一种旅行社用户多维信息画像的构建方法有效
申请号: | 201811154032.1 | 申请日: | 2018-09-30 |
公开(公告)号: | CN109408712B | 公开(公告)日: | 2021-01-26 |
发明(设计)人: | 刘德彬;陈玮;黄远江;刘建涛 | 申请(专利权)人: | 重庆誉存大数据科技有限公司;罗灿 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06Q30/06;G06Q50/14;G06K9/62 |
代理公司: | 重庆智慧之源知识产权代理事务所(普通合伙) 50234 | 代理人: | 余洪 |
地址: | 401121 重庆市渝北*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 旅行社 用户 多维 信息 画像 构建 方法 | ||
1.一种旅行社用户多维信息画像的构建方法,其特征在于,包括如下步骤:
S101、获取样本用户原始数据,根据该原始数据对样本用户的特征和标签进行分析和提取,获得样本用户的特征向量和用户画像信息;
S102、为样本用户每个标签分配权重;所述步骤S102中,采用布尔模型S-TFIWF对用户标签进行加权处理,得到用户标签权重的S-TW模型,具体计算如下:
其中,TW(w,d)为标签w在用户d中是否出现,出现为1,否则为0;N表示用户数量,WT(w)表示用户中出现该标签的数量之和,P表示所有用户消费总金额,T表示某个标签的用户群的消费总金额,T/P表示某个标签的用户群的消费总金额与所有用户消费总金额之比;
S103、设置需要聚类的簇的个数k和相似度阈值θ;
S104、根据样本用户的标签向量,分别计算每两个样本用户之间的相似度,生成相似度矩阵;
S105、根据相似度矩阵和相似度阈值θ,计算邻居矩阵A;若两个样本用户之间的相似度=θ,则该两个样本用户之间互为邻居,取值1,否则,该两个样本用户之间不互为邻居,取值0;
S106、根据每两个样本用户之间的共同邻居数量计算链接矩阵;
S107、根据链接矩阵和样本用户的标签向量,计算每两个样本用户的相似性度量,将相似性度量最高的两个样本用户合并;
S108、利用目标函数以获得最优的聚类结果;
S109、重复步骤S105~S108进行迭代,直至形成k个簇;
S110、利用标签的平均值,为用户画像群划分等级。
2.根据权利要求1所述的一种旅行社用户多维信息画像的构建方法,其特征在于,所述样本用户原始数据包括样本用户基本信息和样本用户旅游行为信息。
3.根据权利要求1所述的一种旅行社用户多维信息画像的构建方法,其特征在于,所述步骤S104中,采用修正余弦相似度算法计算样本用户之间的相似度。
4.根据权利要求1所述的一种旅行社用户多维信息画像的构建方法,其特征在于,所述步骤S107中,采用如下公式计算每两个样本用户的相似性度量:
其中,Pq,Pr分别表示客户q和r的标签向量,link(Pq,Pr)表示客户q和r的共同邻居数,Ci为第i个簇,Cj为第j个簇,ni为Ci的大小(即样本用户的数量),nj为Cj的大小,f(θ)=(1-θ)/(1+θ),f(θ)具有以下性质:Ci中的每个样本用户在Ci中有nif(θ)个邻居。
5.根据权利要求1所述的一种旅行社用户多维信息画像的构建方法,其特征在于,所述步骤S108中,所述目标函数公式如下:
其中,Pq,Pr分别表示客户q和r的标签向量,link(Pq,Pr)表示客户q和r的共同邻居数,k为族的个数,Ci为第i个簇,Cj为第j个簇,ni为Ci的大小(即样本用户的数量),nj为Cj的大小,f(θ)=(1-θ)/(1+θ),f(θ)具有以下性质:Ci中的每个样本用户在Ci中有nif(θ)个邻居。
6.根据权利要求1所述的一种旅行社用户多维信息画像的构建方法,其特征在于,所述步骤S110中,所述等级划分计算方法如下:
设Ti为用户画像群中第i个标签的平均值,其权重为Wi,客户画像群的等级计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆誉存大数据科技有限公司;罗灿,未经重庆誉存大数据科技有限公司;罗灿许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811154032.1/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置