[发明专利]一种基于用户画像数据的客群分类管理方法及装置有效
| 申请号: | 202011225923.9 | 申请日: | 2020-11-05 |
| 公开(公告)号: | CN112396428B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 于扬 | 申请(专利权)人: | 北京易观智库网络科技有限公司 |
| 主分类号: | G06Q30/016 | 分类号: | G06Q30/016 |
| 代理公司: | 北京华清迪源知识产权代理有限公司 11577 | 代理人: | 朱芳 |
| 地址: | 100020 北京市朝阳*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 用户 画像 数据 分类 管理 方法 装置 | ||
本发明实施例提供的一种基于用户画像数据的客群划分方法和装置,获取存储在kudu、hdfs或hive存储器中的用户画像数据;将行为数据、属性数据和标签数据,按照逻辑运算条件和因子运算条件对用户画像数据进行计算,得到目标用户;并将目标用户ID按照预设时间周期与用户画像数据进行关联后,对用户画像数据进行补全和归一化操作,得到满足预设格式的特征数据;将特征数据与预建的特征库进行匹配运算后,将目标用户划分至相应的客群。本发明将用户相关的行为、属性、标签数据按照用户id进行整合,基于kudu、hdfs、hive的特性对行为、属性及标签进行存储,提供高效的数据查询性能。解决了当前场景下进行客群划分使用画像维度单一,难以提升划分准确性的问题。
技术领域
本发明实施例涉及数据分类技术领域,具体涉及一种基于用户画像数据的客群分类管理方法及装置。
背景技术
随着互联网的快速发展,用户规模显著增加及需求多样性愈发复杂,为了对不同特征的用户提供更为匹配的产品、服务、内容,需要对用户进行有效的分群和分析。当前市场对于用户群的划分,主要利用已经收集的客户数据进行规则配置,人工的选择不同的维度及指标对用户进行划分。此类方式受限与操作人的业务水平,且无法从更为细致或难以人工洞察的角度对用户进行准确的划分。针对用户群划分的场景,需要有更为智能化更为简洁的方式提供服务。
然而当前为解决此类场景问题,主要是依赖业务人员基于对于用户的理解,结合收集到的用户属性,人工进行规则配置进行划分,其中会有如下的问题造成难以对用户进行有效划分的缺陷。第一,过度依赖对于操作人的业务经验,需要进行反复的尝试去确定最终的划分规则。第二,人工划分的方式仅仅可以对用户进行粗粒度的划分,难以从更细粒度发现用户之间的差异进行客群划分。第三,受限于对于数据的理解,无法全面的利用用户全部的信息,存在隐藏且可对用户进行区分的因素未纳入规则范围。
发明内容
针对现有技术的客群划分系统的不足,本发明实施例提供一种基于用户画像数据的客群划分方法及装置,提供针对于不同能力层次的使用人使用不同的方式对客户进行划分,且针对于已划分的客群,帮助使用者快速了解客群之间的差异及特点,在客户数据方面,系统支持利用客户产生的行为记录、收集的客户信息、客户标签等;在客群划分方面,系统支持自定义行为、属性规则的配置方式,支持利用有监督和无监督的算法自动对所选择的目标客群进行不同层次的划分,展示不同客群的差异共使用者进行参考。其具体技术方案如下:
根据本发明实施例提供的一种基于用户画像数据的客群划分方法,包括步骤:获取存储在kudu、hdfs或hive存储器中的用户画像数据;其中,所述用户画像数据包括行为数据、属性数据和标签数据;所述行为数据包括:用户 ID、行为发生时间、行为内容;
将所述行为数据、属性数据和标签数据作为输入条件,按照逻辑运算条件和因子运算条件对所述用户画像数据进行计算,得到目标用户;并将所述目标用户ID按照预设时间周期与所述用户画像数据进行关联后,对所述用户画像数据进行补全和归一化操作,得到满足预设格式的特征数据;所述因子运算条件包括数值类型因子、字符类型因子和时间类型因子;所述特征数据包括行为特征数据、属性特征数据和标签特征数据;
将所述所述特征数据与预建的特征库进行匹配运算后,将所述目标用户划分至相应的客群。
进一步的,还包括采用主成分分析算法对目标用户在不同的客群中的主成分得分,根据所述得分完成客群评价。
进一步的,对所述用户画像数据按照行为发生时间创建分区,并对当日分区行为数量大于预设次数时,进行动态分桶存储。
进一步的,所述将所述行为数据、属性数据和标签数据作为输入条件,按照逻辑运算条件和数值运算条件对所述用户画像数据进行计算,得到目标用户;并将所述目标用户ID按照预设时间周期与所述用户画像数据进行关联后,对所述用户画像数据进行补全和归一化操作,得到满足预设格式的特征数据;具体包括步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京易观智库网络科技有限公司,未经北京易观智库网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011225923.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





