[发明专利]一种基于大数据的用户属性识别方法在审
申请号: | 201911286334.9 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111045910A | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 吴强 | 申请(专利权)人: | 中国电信集团工会上海市委员会;中国电信股份有限公司上海分公司 |
主分类号: | G06F11/34 | 分类号: | G06F11/34;G06F16/2458 |
代理公司: | 上海申新律师事务所 31272 | 代理人: | 吴轶淳 |
地址: | 200120 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 用户 属性 识别 方法 | ||
本发明公开了一种基于大数据的用户属性识别方法,属于数据分析与挖掘技术领域,包括:步骤S1,采集预定时间段内出现在预定区域的用户的话单记录;步骤S2,根据话单记录提取得到用户的停留天数数据和停留时长数据,以及用户的上网行为数据;步骤S3,根据停留天数数据和停留时长数据得到每个用户的第一属性值;步骤S4,根据上网行为数据得到每个用户的第二属性值;步骤S5,根据第一属性值和第二属性值进行加权求和处理后得到对应的目标属性值;步骤S6,根据目标属性值对用户进行属性划分;有益效果是:可以对APP使用规律上较为相近的用户进行进一步的属性识别,提高了用户属性的识别精度。
技术领域
本发明涉及数据分析与挖掘技术领域,尤其涉及一种基于大数据的用户属性识别方法。
背景技术
随着信息技术和网络技术的飞速发展,数据分析已取代数据计算成为信息技术领域的中心,对大数据中包含海量信息中的可用数据资源进行数据分析和数据挖掘日渐成为一种趋势和潮流。在无法直接获取用户基本职业属性等信息的情况下,使用机器学习算法对用户画像做进一步分析,建立基本属性模型,进而快速识别用户的画像属性,成为一种主流的大数据识别用户属性的方法。
现有技术中,一般通过机器学习来分析用户属性的大数据方法,例如SVM和神经网络等,并利用互联网通信数据,如用户使用APP的数据,进行建模来判断用户的基本属性。这些机器学习算法主要依据用户使用的APP数据信息进行学习和输出,然而现有技术在更为细致的用户属性识别领域将难以发挥作用,在对职业不同而APP使用规律上较为相近的用户职业属性识别时就难以进行精准识别,例如,在针对上海迪士尼乐园后勤区域的保安和装卸工的身份属性进行识别时,由于两种身份属性的人群在APP的使用记录上没有很大的区别,单纯通过用户APP数据分析将难以准确识别出区域内哪些用户是保安、哪些用户是装卸工。
发明内容
根据现有技术中存在的上述问题,现提供一种基于大数据的用户属性识别方法,通过采集用户于预定区域的停留时长和停留天数的数据,计算得到第一属性值,将第一属性值作为修正因子与通过上网行为数据识别得到的第二属性值进行加权求和后得到最终属性值,从而可以对APP使用规律上较为相近的用户进行进一步的属性识别,提高了用户属性的识别精度。
上述技术方案具体包括:
一种基于大数据的用户属性识别方法,其中包括:
步骤S1,采集预定时间段内出现在预定区域的所有用户的话单记录;
步骤S2,根据所述话单记录提取得到每个所述用户于所述预定区域内的停留天数数据和停留时长数据,以及每个所述用户的上网行为数据;
步骤S3,根据所述停留天数数据和所述停留时长数据计算得到每个所述用户的第一属性值;
步骤S4,根据所述上网行为数据计算得到每个所述用户的第二属性值;
步骤S5,根据所述第一属性值和所述第二属性值进行加权求和处理后得到每个所述用户对应的目标属性值;
步骤S6,根据所述目标属性值对所述用户进行属性划分。
优选地,其中,所述步骤S2中,通过提取所述话单记录中的时间字段处理得到所述用户于所述预定区域内的停留天数数据和停留时长数据。
优选地,其中,所述上网行为数据包括所述用户使用移动终端内各个应用程序的种类和频率。
优选地,其中,所述预定时间段包括多个自然周;
所述步骤S3具体包括:
步骤S31,根据所述预定区域的区域种类分别预先设定对应的目标停留时长值和对应的每周目标停留天数值;
步骤S32,对所述停留时长数据满足所述每周目标停留天数值的所述用户进行提取,得到预分类用户集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信集团工会上海市委员会;中国电信股份有限公司上海分公司,未经中国电信集团工会上海市委员会;中国电信股份有限公司上海分公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911286334.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置