[发明专利]基于用户个性化生活模式的POI推荐方法在审
| 申请号: | 202111303987.0 | 申请日: | 2021-11-05 |
| 公开(公告)号: | CN114065024A | 公开(公告)日: | 2022-02-18 |
| 发明(设计)人: | 孔祥杰;黄志强;沈国江;刘志 | 申请(专利权)人: | 浙江工业大学 |
| 主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06F16/9537;G06N3/04;G06N3/08;G06Q50/00 |
| 代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵 |
| 地址: | 310014 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 用户 个性化 生活 模式 poi 推荐 方法 | ||
1.一种基于用户个性化生活模式的POI推荐方法,其特征在于,包括以下步骤:
(1)对原始数据进行预处理;对用户签到数据进行清洗,以及用户签到数据的规范化处理;
(2)对步骤(1)中所述数据进行时间划分;将用户签到数据按时间进行排序,然后按天进行划分得到用户历史签到子序列和最近签到子序列;
(3)对步骤(2)中所述数据进行用户个性化生活模式建模;首先提取用户和用户签到序列中POI类型之间的潜在信息,计算公式如下:
其中,Uu表示用户u的嵌入向量,表示用户u访问的POI类型j的嵌入向量,和是两个权重矩阵,分别用于提取用户和POI类型潜在信息;
利用长短期记忆神经网络模型建模用户关于POI类型的偏好,计算公式如下所示:
其中,和分别代表单个长短期记忆神经网络模型单元的输出结果和单元状态,为用户和POI类型之间的潜在信息,模型最终输出表示用户对于POI类型的偏好;
提取用户和用户历史签到序列中POI的潜在信息,计算公式如下:
其中,表示用户u历史签到序列中第j个POI的嵌入向量,和是两个权重矩阵,分别用于提取用户和用户历史签到序列中POI的潜在信息;
利用长短期记忆神经网络模型建模用户历史签到序列中的POI偏好,计算公式如下:
其中,为用户和用户历史签到序列中POI的潜在信息,和分别代表单个长短期记忆神经网络模型单元的输出结果和单元状态,表示用户历史签到序列中对于POI的偏好,即用户的长期偏好,同时所有用户历史签到子序列中的转化为|Sh|为单个历史签到子序列的长度;
提取用户和用户最近签到序列中POI的潜在信息,计算公式如下:
其中,为用户最近签到序列中第j个POI的嵌入向量表示,和是两个权重矩阵,分别用于提取用户和用户最近签到序列中POI的潜在信息;
利用长短期记忆神经网络模型建模用户最近签到序列中的POI偏好,计算公式如下:
其中,为用户和用户最近签到序列中POI的潜在信息,和分别代表单个长短期记忆神经网络模型单元的输出结果和单元状态,表示用户最近签到序列中对于POI的偏好,即用户的短期偏好,同时所有用户最近签到序列中的转化为|Sn|为用户最近签到序列的长度;
将一周时间划分为48个时间段,其中包括工作日24个时间段,周末24个时间段,将所有用户签到序列中的具体时间对应到这48个时间段;
对于每个时间段,构造每个时间段的POI集合POI集合中的每个POI是在该时间段至少有一个用户访问过的POI,那么对于每一段用户历史签到子序列Sh可以得到一个长度为|Sh|的签到时间段序列
可以计算不同时间段POI集合的相似度,计算公式如下:
其中,Hi和Hj分别表示时间段i和时间段j中的POI集合,τi,j表示时间段i和时间段j中POI集合的相似度;
计算带有时间权重信息的用户历史签到子序列表示sh,计算公式如下:
其中,表示当前时间段c与用户历史签到子序列Sh中第j个时间段的相似度,为用户历史签到子序列Sh中第t个POI的LSTM单元状态,则n-1段用户历史签到序列Sh∈{S1,S2,...,Sn-1}可以表示为{s1,s2,...,sn-1},用户最近签到用平均池化来得到,计算公式如下:
计算每一段历史签到子序列sh∈{s1,s2,...,sn-1}对于最近签到序列sn的影响,计算公式如下:
其中,C(S)为归一化因子,函数g(sh)=Whsh用于生成sh的表示,Wh为可训练的权重矩阵,函数计算最近签到序列sn与历史签到序列sh的相关度,则为序列级别的用户偏好,即用户历史签到子序列对用户当前偏好的影响;
对每个用户历史签到子序列,计算用户相邻两次签到的转移距离,计算公式如下:
其中,Di表示用户历史签到子序列中第i+1个POI到第i个POI的转移距离,表示第i个POI的经度,表示第i个POI的纬度,R为地球半径;
对每个时间段的用户个性化行为模式建模,计算每个时间段内,所有用户签到子序列的最大转移距离,计算公式如下:
Dt=max(Di) (12)
其中,Dt表示第t个时间段内用户历史签到子序列中用户的最大转移距离;
(4)根据步骤(3)中所获用户个性化偏好模式和用户个性化行为模式,对POI集合进行过滤,得到POI候选集;
计算用户最喜欢的Top-k个POI类型,计算公式如下:
Yis=σ(Ws·Input+bs);i=1,2,...,P (14)
其中,σ表示softmax函数,分别为权重矩阵,Ci表示第i个POI类型的嵌入向量,Uu表示用户的嵌入向量,表示用户对POI类型的偏好;
根据用户最喜欢的Top-k个类型对每个用户的POI候选集进行过滤,计算公式如下:
其中,Vu表示用户原始的POI候选集,表示经过第一层过滤后的POI候选集;
根据用户下一次访问POI时间,结合用户在该时间段内的用户个性化行为模式,从POI候选集中过滤出与用户上一次签到位置的距离在该时间段用户最大转移距离内的POI,并加入该范围内属于用户偏好Top-k个类型的但用户未去过的POI,得到最终的POI候选集,计算公式如下:
其中,表示经过第一层过滤后的POI候选集,表示经过第二层过滤后的POI候选集,即最终的POI候选集;
(5)对POI候选集重新排序,得到用户最喜欢的Top-k个POI;计算POI候选集中与用户上一个访问位置的距离,计算公式如下:
其中,和分别表示用户上一个访问位置的经度和纬度,和分别表示POI候选集中第j个POI的经度和纬度;
计算用户对于POI候选集中POI类型之间的偏好,用户历史签到序列和用户最近签到序列中用户对于POI候选集中POI的偏好,计算公式如下:
其中,Uu表示用户的嵌入向量,Cc表示POI候选集中POI类型的嵌入向量,Vv表示POI候选集中POI的嵌入向量;
计算用户历史签到子序列对于POI候选集中POI的偏好影响,计算公式如下:
其中,其中Wp∈R|L|×2d表示POI候选集中POI的投影矩阵,|L|表示POI候选集中POI的个数;
对上述指标分别进行归一化处理,对POI候选集中的POI进行重新排序得到最终用户最有可能访问的Top-K个POI,计算公式如下:
其中,fD,fv,fs分别表示归一化函数,WD,Wv,Ws分别表示距离,用户偏好和历史签到序列对POI偏好影响的权重矩阵。
2.如权利要求1所述的一种基于用户个性化生活模式的POI推荐方法,其特征在于:步骤(1)所述的对用户签到数据进行清洗,包括清除缺失值、噪声数据、删除签到记录过少的数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111303987.0/1.html,转载请声明来源钻瓜专利网。





