[发明专利]一种基于移动大数据的手机用户行为相似度分析方法在审
申请号: | 201810484072.6 | 申请日: | 2018-05-19 |
公开(公告)号: | CN110572813A | 公开(公告)日: | 2019-12-13 |
发明(设计)人: | 张广志;成立立;刘增礼;秦星星 | 申请(专利权)人: | 北京融信数联科技有限公司 |
主分类号: | H04W8/18 | 分类号: | H04W8/18;H04W8/20;G06N20/00;G06Q30/02 |
代理公司: | 11333 北京兆君联合知识产权代理事务所(普通合伙) | 代理人: | 初向庆 |
地址: | 100085 北京市海淀区上地*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 夹角余弦 手机用户 行为相似度 活动行为 驻留 时间段 扇区 时长 移动轨迹信息 电信运营商 相似程度 信令数据 大数据 用户群 判定 采集 人群 移动 分析 统计 研究 | ||
1.一种基于移动大数据的手机用户行为相似度分析方法,其特征在于,包括以下步骤:
(1)数据采集:利用电信运营商的信令数据,在一个时间段内,对一个用户群中每个用户IMSI识别号所在的基站扇区位置、进出扇区时间信息进行采集,并进行数据清洗;
(2)数据预处理:对进出基站缺失信令进行插值补偿;
(3)统计PF、GF,计算PF-IGF值:统计每个用户在一定时间段内在每个扇区中出现的次数或驻留时长PF,以及所有用户在每个扇区中出现的次数或驻留时长的均值GF,其中,PF值按天取均值,GF值按人天取均值,并将之归一化;使用归一化之后的PF值和GF值进行PF/GF计算,得到每个用户的PF-IGF值;
(4)计算夹角余弦值:采用以下公式计算每两个手机用户的PF-IGF值的夹角余弦值cosθ:
其中,Ai表示手机用户A在第i个扇区的PF-IGF值,Bi表示用户B在第i个扇区的PF-IGF值,i=1,2,……n。
(5)用户行为相似度判定:根据所得的夹角余弦值cosθ,判定两个用户的行为相似度:夹角余弦值cosθ越接大,表示这两个手机用户的活动行为轨迹越相近;夹角余弦值cosθ的值越小,表示这两个手机用户的活动行为轨迹越不相关。
2.根据权利要求1所述的基于移动大数据的手机用户行为相似度分析方法,其特征在于:步骤(1)中所述的时间段按天为单位;所述的用户群,是选定研究范围内的多个移动用户。
3.根据权利要求1所述的基于移动大数据的手机用户行为相似度分析方法,其特征在于:步骤(2)所述的对进出基站缺失信令进行插值补偿,具体方法是:如果用户在统计时间段内只有进入某扇区的时间而没有离开该扇区的时间,或者只有离开某扇区的时间而没有进入该扇区的时间,则需要对缺失数据进行插补,插补时间点是该统计时间段的起始时间和结束时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京融信数联科技有限公司,未经北京融信数联科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810484072.6/1.html,转载请声明来源钻瓜专利网。