[发明专利]基于手机信令的行为特征提取方法及相关装置有效
申请号: | 202210266442.5 | 申请日: | 2022-03-17 |
公开(公告)号: | CN114626340B | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 张航;张岩;闫嘉 | 申请(专利权)人: | 智慧足迹数据科技有限公司 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06N7/01 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 张欣欣 |
地址: | 100000 北京市东城区王*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 手机 行为 特征 提取 方法 相关 装置 | ||
1.一种基于手机信令的行为特征提取方法,其特征在于,所述方法包括:
获取用户的行为编码,其中,所述行为编码是用户在预设时间段内、按照驻留时间顺序对驻留信息进行编码得到的,所述用户的驻留信息是根据所述用户的手机信令得到的;
利用预设概率分布,确定所述行为编码在预设主题下的概率;
根据所述行为编码在所述预设主题下的概率,计算所述用户的行为特征,其中,所述用户的行为特征的维度等于所述预设主题的个数;
所述方法还包括:
获取语料库,其中所述语料库包括多个用户的行为编码;
对所述语料库进行吉布斯采样,确定预设联合分布的第一预设参数和第二预设参数,其中,所述预设联合分布用于表征所述预设主题和所述语料库中的行为编码的联合分布,所述第一预设参数用于表征语料库中预设主题的分布参数,所述第二预设参数用于表征语料库中行为编码与所述预设主题的分布参数;
根据所述预设联合分布、所述第一预设参数及所述第二预设参数,对所述预设主题进行汇总,得到边缘分布;
根据所述预设联合分布和所述边缘分布,确定所述预设概率分布。
2.如权利要求1所述的基于手机信令的行为特征提取方法,其特征在于,所述驻留信息包括驻留地点、驻留起始时间、驻留时长及驻留日期,所述获取用户的行为编码的步骤包括:
根据驻留地点及所述驻留地点所属的预设区域包括的预设地点类型,确定与所述驻留地点对应的目标预设地点类型;
根据预设区间分段确定与所述驻留起始时间对应的目标区间分段,其中,所述预设区间分段是对一天内时间区间划分后得到的;
根据预设时长分段确定与所述驻留时长对应的目标时长分段,其中,所述预设时长分段是对一天内的时长划分后得到的;
根据预设的日期与日期特征之间的映射关系,确定与所述驻留日期对应的目标日期特征;
根据所述目标预设地点类型、所述目标区间分段、所述目标时长分段及所述目标日期特征,生成所述行为编码。
3.如权利要求2所述的基于手机信令的行为特征提取方法,其特征在于,所述预设区域包括多个栅格,每一所述栅格对应一个预设地点类型,所述根据驻留地点及所述驻留地点所属的预设区域包括的预设地点类型,确定与所述驻留地点对应的目标预设地点类型的步骤包括:
确定所述驻留地点所属的目标栅格;
将所述目标栅格对应的预设地点类型作为所述目标预设地点类型。
4.如权利要求1所述的基于手机信令的行为特征提取方法,其特征在于,所述行为编码为多个,所述预设主题为多个,所述预设主题的数量小于所述行为编码的数量,所述行为编码在预设主题下的概率包括每一所述行为编码在每一所述预设主题下的概率,所述根据所述行为编码在所述预设主题下的概率,计算所述用户的行为特征的步骤包括:
计算所有所述行为编码在每一所述预设主题下的概率的平均值,得到每一所述预设主题对应的行为特征;
将所有预设主题对应的行为特征作为所述用户的行为特征。
5.如权利要求1所述的基于手机信令的行为特征提取方法,其特征在于,所述第一预设参数包括第一分布参数和第二分布参数,其中,所述第一分布参数用于表征所述预设主题的多项分布的参数,所述第二分布参数用于表征所述第一分布参数的狄利克雷分布的参数。
6.如权利要求1所述的基于手机信令的行为特征提取方法,其特征在于,所述预设主题的个数为K,对所述语料库中行为编码去重后的行为编码的个数为V,所述第二预设参数为的矩阵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智慧足迹数据科技有限公司,未经智慧足迹数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210266442.5/1.html,转载请声明来源钻瓜专利网。