[发明专利]一种基于表征学习的用户生活模式识别方法在审
申请号: | 201910761316.5 | 申请日: | 2019-08-17 |
公开(公告)号: | CN112395474A | 公开(公告)日: | 2021-02-23 |
发明(设计)人: | 朱悦;戴吉秋;高兆庆;张宸瑞;路国平 | 申请(专利权)人: | 北京智数时空科技有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/907;G06F16/909;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100029 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 表征 学习 用户 生活 模式识别 方法 | ||
1.一种基于表征学习的用户生活模式识别方法,其特征在于,包括以下步骤,
第一步,特征选取步骤;首先将从原始轨迹数据中提取签到兴趣点类别转移序列;
其次,签到兴趣点类别转移序列进入预处理层,输出每个用户的生活模式初级表征;
第二步,表征学习步骤;利用word2vec CBOW表征学习方法学习用户的向量表征,同时保留用户移动的语义和时间信息;
第三步,模块识别步骤;通过经典的聚类方法对生活模式进行聚类。
2.根据权利要求1所述的一种基于表征学习的用户生活模式识别方法,其特征在于:所述的特征选取步骤包括以下步骤,
S1:将轨迹中的GPS信息与行为信息分离,将行为信息和离散化的时间片作为表征学习的基本单元,所述的行为信息是兴趣点签到类别;
S2:通过特征选取模块,获得每个用户具有代表性的周中与周末用户时空行为序列;
而后,用户行为特征序列进入表征学习模块,该模块定义窗口宽度w,利用某一行为单元附近的状态学习行为单元的向量表征。
3.根据权利要求1所述的一种基于表征学习的用户生活模式识别方法,其特征在于:所述的表征学习步骤包括以下步骤,
S3:利用word2vec CBOW模型,首先随机初始化各单元向量的值,而后对某一基本单元窗口宽度内邻单元向量求和,并试图通过神经网络预测该行为单元;
利用梯度下降法经过多轮训练后,神经网络可以较为准确地通过邻居向量重构目标单元,因此中间层权值即可作为状态的向量表征,该表征将基本状态的性质保留于隐空间中;
S4:获得基本单元的向量表征后,类似word2vec中对于句子表征的处理,将每个用户的行为基本单元向量求均值,获得用户的语义时空行为表征。
4.根据权利要求1所述的一种基于表征学习的用户生活模式识别方法,其特征在于:所述的模块识别步骤包括以下步骤,
S5:对于各用户得到的语义时空行为向量进行聚类,由于隐空间为球面空间,可采用余弦距离作为距离度量,采取k-means,密度聚类等方法,发现特征向量聚类模式,并通过聚类中心向量返回用户行为习惯特征序列,获得典型的用户语义时空行为模式;
S6:将数据中的位置信息加入分析,根据生活模式识别结果,可以研究属于不同生活模式的用户在城市中各个时间段的位置分布情况,了解各不同人群在城市中的通勤过程;
S7:验证算法学习获得的表征向量可以度量不同类别POI在不同时间下的语义相似性,对一些特例进行分析,捕捉同一时间不同类别POI之间的相似性;衡量同类POI在不同时间的相似程度;
S8:从整体上验证了表征向量对语义的捕捉,挑选POI种类,检测相似度,每一大类POI的向量表征取小类POI均值处理;
S9:对获得的用户行为向量进行聚类,以获得城市中的典型生活模式;采取基于余弦距离的k-means算法,获得了周中生活模式;根据每一类的POI类别、以及每一类中心生活模式,确定此类生活模式的语义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智数时空科技有限公司,未经北京智数时空科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910761316.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种出租车车载评价器
- 下一篇:一种虚拟骑马类的VR游戏设备及操控方法