[发明专利]一种基于自监督学习的社交网络用户轨迹分析方法在审
申请号: | 202110649825.6 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113378074A | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 周帆;代雨柔;余柳;钟婷;敬鑫 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06F16/9537;G06Q50/00 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 罗江 |
地址: | 610000 四川*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 监督 学习 社交 网络 用户 轨迹 分析 方法 | ||
1.一种基于自监督学习的社交网络用户轨迹分析方法,其特征在于,包括如下步骤:
S1、对真实轨迹数据进行预处理,把数据划分为训练集和测试集,然后对每个数据集进行数据增强处理,再对轨迹数据进行嵌入处理,得到轨迹点的向量表示;
S2、将数据增强处理后的轨迹数据和轨迹点的向量表示输入到预训练模型中,对轨迹时间段进行划分为当前轨迹Tc和历史轨迹Th,在预训练模型中利用对比学习构建正负样本和噪声对比损失函数,学习不同轨迹点之间的互信息,区分真实的有利位置和少数负面位置来捕获隐含的移动意图,并保存预训练模型中得到的参数;
S3、将测试集的数据输入到预训练模型中,将步骤S2中得到的参数迁移到下游任务进行微调,以原始的训练集和测试集作为下游任务的输入,预测用户的运动意图。
2.根据权利要求1所述的基于自监督学习的社交网络用户轨迹分析方法,其特征在于:所述步骤S1中的预处理具体是指:对数据集的数据进行了清洗,对于每个数据集,删除了少于5个用户访问的POI,对于每个用户,我们将所有签到的位置连接起来形成一条轨迹,随后,将每条轨迹划分为子轨迹,设置每条轨迹的时间间隔为6小时,筛选并剔除少于5个子轨迹的用户。
3.根据权利要求1所述的基于自监督学习的社交网络用户轨迹分析方法,其特征在于:所述的把数据划分为训练集和测试集具体是将80%的数据划分为训练集,20%的数据划分为测试集。
4.根据权利要求1所述的基于自监督学习的社交网络用户轨迹分析方法,其特征在于:所述步骤S1中的数据增强处理包括轨迹子采样、空间增强和时间增强;所述空间增强是指:两条轨迹上的两个轨迹点是同一种类的点,且两个点在空间上的距离在5公里之内,则满足交换条件,交换后得到增加轨迹;所述的时间增强是指:两条轨迹上的两个轨迹点是同一种类的点,且两个点在时间上相距在一小时之内,则满足交换条件,交换后得到增加轨迹。
5.根据权利要求1所述的基于自监督学习的社交网络用户轨迹分析方法,其特征在于:所述的对轨迹数据进行嵌入处理,得到轨迹点的向量表示具体是指:使用word2vec技术对训练集数据进行训练,得到初始化的所有轨迹的嵌入向量矩阵,将每一个轨迹点转化为向量表示。
6.根据权利要求1所述的基于自监督学习的社交网络用户轨迹分析方法,其特征在于:将轨迹数据输入到预训练模型中具体包括:将当前轨迹Tc输入到模型中的GRU模块,不仅考虑连续轨迹点之间的空间距离ΔDt-1,t和时间间隔ΔTt-1,t,还考虑了非连续的时空间隔ΔDt-1,t+1和ΔTt-1,t+1,更新过程:
h’t=GRU(lt,ht-1,ΔTt-1,t,ΔDt-1,t)
h”t=GRU(lt,ht-1,ΔTt-1,t+1,ΔDt-1,t+1)
ht=(h’t;h”t);
还包括将历史轨迹Th输入到模型中的注意力机制模块,通过查询历史记录中与当前轨迹Tc最相似的轨迹Γ来捕捉人类活动的历程:
F(ht,oi)=tanh(htWo)。
7.根据权利要求1所述的基于自监督学习的社交网络用户轨迹分析方法,其特征在于:所述的构建正负样本和噪声对比损失函数具体是:将真实预测值的轨迹点zt+k作为正样本,从其他用户的轨迹中随机采样j个点作为负样本对应于潜在空间里的状态,构造了噪声对比损失函数:
通过降低噪声对比损失函数的值,来增大正样本与锚数据之间的互信息,减少负样本与锚数据之间的互信息,通过互信息来判断轨迹点之间的相似情况,提高预测精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110649825.6/1.html,转载请声明来源钻瓜专利网。