[发明专利]一种基于大数据建立用户画像的方法及系统在审
| 申请号: | 201810438144.3 | 申请日: | 2018-05-09 |
| 公开(公告)号: | CN108629633A | 公开(公告)日: | 2018-10-09 |
| 发明(设计)人: | 张铁舰;付安龙 | 申请(专利权)人: | 浪潮软件股份有限公司 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N99/00 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 高经 |
| 地址: | 250100 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于大数据建立用户画像的方法及系统,属于大数据应用技术领域。本发明的基于大数据建立用户画像的方法包括以下步骤:S1:构建用户画像标签体系。S2:对数据进行预处理。S3:样本自动标注。S4:用户数据采样样本不平衡处理。S5:特征工程。S6:模型训练。采用多分类模型和二分类模型相结合。S7:模型优化。该发明的基于大数据建立用户画像的方法及系统能够提高用户画像准确度,从而可以构建个性化智能推荐系统、精准营销及精准广告,具有很好的推广应用价值。 | ||
| 搜索关键词: | 大数据 画像 构建 预处理 应用技术领域 智能推荐系统 多分类模型 采样样本 精准广告 精准营销 模型训练 模型优化 用户数据 自动标注 准确度 二分类 样本 个性化 标签 | ||
【主权项】:
1.一种基于大数据建立用户画像的方法,其特征在于:所述方法包括以下步骤:S1:构建用户画像标签体系将用户数据归一化到目标有效的标签体系,标签分为结构化和非结构化,结构化标签有明确层级关联父子分类关系,标签规整,非结构化标签没有层级关系,标签分散;S2:对数据进行预处理;S3:样本自动标注采用样本半监督学习自动标注;S4:用户数据采样样本不平衡处理对于数据层采样样本进行过采样或欠采样处理,对于算法层采样样本进行代价敏感和集成学习处理;S5:特征工程样本集合构建完成,从样本中提取特征,根据特定数据类型,做特征分类;S6:模型训练采用多分类模型和二分类模型相结合;S7:模型优化分析模型是过拟合或欠拟合,并对模型进行优化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮软件股份有限公司,未经浪潮软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810438144.3/,转载请声明来源钻瓜专利网。
- 上一篇:预测用户收入的方法、装置及计算机可读存储介质
- 下一篇:广告用方法和系统





