[发明专利]一种基于车联网数据的用户出行喜好分析方法在审
申请号: | 201611193271.9 | 申请日: | 2016-12-21 |
公开(公告)号: | CN106777169A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 张年超;耿文童;李旭 | 申请(专利权)人: | 北京车网互联科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京金智普华知识产权代理有限公司11401 | 代理人: | 巴晓艳 |
地址: | 100082 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 联网 数据 用户 出行 喜好 分析 方法 | ||
1.一种基于车联网数据的用户出行喜好分析方法,其特征在于,所述方法基于假定以用户驻留点的聚点附近各POI类型在该地点所有POI点的占比,表示其前往每一类型POI点的概率为模型,通过用户的聚点GPS信息进行逆地理编码,获知用户出行地点的空间属性,随后根据用户的出行行为推测其兴趣所在,针对提出的评价指标,依次对用户在每一POI点的类型作出评分,计算所得的指标权重值得到用户在某一POI点类型加权后的得分,最终将用户所有POI点类别的得分按照一定顺序进行排列,获得用户出行喜好。
2.根据权利要求1所述的方法,其特征在于,所述方法包括:
S1:将用户的驻留点聚类,具体为对用户的驻留点进行聚类,确定某地点的中心点,称为驻留点的聚点;
S2:筛选行程,具体为分析用户工作之余的出行喜好,删去用户以“家”或“公司”为终点的行程,保留其余有效行程;
S3:逆地理编码,具体为根据用户的驻留点的聚点进行逆地理编码,规定此过程选取聚点周围半径r米内的POI;
S4:计算POI类型占比,由上一步得到所有聚点附近r米内所包含的各类POI信息与总数,随后逐个输出每一聚点附近各个类型的POI点的数目,并按类型计算POI点的占比,得到矩阵P;
S5:抽取指标数据;
S6:计算每种类型各指标的期望值;
S7:指标数据评分,具体为在每一个指标内部,首先对用户数据分布情况做出判别,观测其服从何种分布,将数据正态化,最终基于正态分布得出用户在每一类POI点的三种指标下各自的得分;
S8:计算指标权重、计算各POI类型下的指标权重;
S9:计算每一POI类型的得分。
3.根据权利要求2所述的方法,其特征在于,所述S5具体为抽取用户驻留点的聚点的在三个指标下的数据,所述三个指标分别是:到达次数Time、停留总时长Dura和驶入行程总时长Dura2。
4.根据权利要求2所述的方法,其特征在于,所述S6具体为根据S4和S5中用户所到达的每一个驻留点的聚点内每一类型的三个指标的数学期望值,其中,数学期望值计算方法如下:
到达次数的数学期望值=POI点的占比×到达次数Time;
停留时长的数学期望=POI点的占比×停留总时长Dura;
驶入行程时长的数学期望=POI点的占比×驶入行程总时长Dura2。
5.根据权利要求2所述的方法,其特征在于,所述S7包括:
S71:确定数据服从何种分布;
S72:原始数据正态化:具体为对原始数据做一次非线性变换,使其服从标准正态分布;
S73:对数据进行分组:具体为依据公式计算需要划分的组数;
S74:确定组距:对于每一个指标,计算每一POI类型中数据的全距,根据最大值与最小值计算得到组距;
S75:计算累积百分比:确定每一组数值的上限与下限,求出每一组中落入的数据点的个数、每一组的组中值,从而得到组中值以下的累加次数,将累加次数与总的用户人数作比,得到每一组的累积百分比;
S76:查询得到z分数;
S77:计算T分数,具体为根据公式对分数作线性变换,以消除负值对结果的影响,得到每一组分数的上限与下限;
S78:计算用户在每一指标下各POI类型的得分:查找用户的数据所对应的分数区间,在区间内将数据按照线性处理对应到某一分数值,获得用户在三个指标下的得分值。
6.根据权利要5所述的方法,其特征在于,所述S76中所述z分数为标准分,所述标准分在数据服从正态分布的条件下,将原始数据转化为z分数可以去除量纲,因此可以对同一整体不同类型的数据进行比较,由累积百分比查询正态分布表得到每一组的z分数,将分组后的组中值以下的累积百分比的比值作为组内的百分比上限。
7.根据权利要求2所述的方法,其特征在于,所述S8具体为利用层次分析法确定三个指标的权重值大小,根据类型确定其中三个指标的权重值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京车网互联科技有限公司,未经北京车网互联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611193271.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置