[发明专利]一种基于数据自学习的画像构建方法有效
申请号: | 202110476312.X | 申请日: | 2021-04-29 |
公开(公告)号: | CN113064904B | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 张中华;王树峥;欧钰鹏;张伟;金明林 | 申请(专利权)人: | 济南慧天云海信息技术有限公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/25;G06F9/445 |
代理公司: | 济南克雷姆专利代理事务所(普通合伙) 37279 | 代理人: | 张祥明 |
地址: | 250101 山东省济南市高新区*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 自学习 画像 构建 方法 | ||
本发明公开了一种基于数据自学习的画像构建方法,所述方法通过定义算法,发布并授权给相应的实体算法权限,给实体定义一个标签并绑定标签与算法之间的对应关系;将一个实体下的多个标签进行分组,指定每个分组下的标签列表组合;将实体与数据集进行绑定,并指定数据集之间关联条件;构建实体画像任务。通过本发明方法进行画像构建,能够更加直观的表达实体和画像之间的关系,能够更加精细化的控制标签的生成过程、画像的构建过程,通过阈值参数和输入参数的动态调整能够更加灵活的调整算法的实现过程,从而达到算法的复用能力。另外通过分组和标签的二次关联分析,能够动态反馈标签的精准度,从而为算法参数的调整提供了依据。
技术领域
本发明涉及数据画像技术领域,具体提供一种基于数据自学习的画像构建方法。
背景技术
数据挖掘,是利用一种工具和算法,对数据进行处理和模型训练,从而能够发现数据之间的关联关系和隐藏于数据之间信息的过程。
数据画像,是利用一种工具对数据进行抽象化,提取出数据蕴含的典型特征,并赋予其标签名称,给数据内容进行打标签,同时基于一定的统计学要素、场景等描述,形成一个画像原型的过程。
随着科技的发展,我们已经进入万物互联的智能时代,人与人之间的交流更加频繁,数据价值应用凸显,实现数据的智慧化应用成为各行各业的利器。企业、产品、业务、人等都可以借助数据画像从而更深刻的理解企业经营情况、产品使用情况、业务经营情况、人的健康状况等,依靠数据决策,依靠数据提供的参考,更科学更智慧。
随着海量数据产生以及大数据技术的不断发展,数据之间的壁垒被打破从而实现了数据的互联互通,使得数据之间关联关系得以发掘和利用。其中画像的构建就是为了更加形象直观的展现数据之间的关系,发掘数据的价值,从而为现实中的决策、行为起到积极的指导作用。最常见的就是个人在消费互联网上的行为数据会被构建用户画像从而实现精准营销。
发明内容
常见的画像构建系统是通过预先设定的规则对数据进行打标签,然后进行标签分组从而按条件进行画像的直观展示,这种画像的构建方法无法满足画像的动态生成过程和画像的自学习完善能力管理服务和数据发布服务以及数据接口的转发服务,从而满足不同应用系统需求的多样性。本发明在已有的画像构建方式的基础上,实现画像数据的动态学习和画像参数的自动完善,即一种基于数据自学习的画像构建方法。
为实现上述目的,本发明提供了如下技术方案:
一种基于数据自学习的画像构建方法,所述方法通过定义算法,发布并授权给相应的实体算法权限,给实体定义一个标签并绑定标签与算法之间的对应关系;
将一个实体下的多个标签进行分组,指定每个分组下的标签列表组合;
将实体与数据集进行绑定,并指定数据集之间关联条件;
构建实体画像任务。
所述方法通过对实体画像任务的标签列表作为数据源进行二次关联分析,剖析实体与各标签之间的关系,对画像的精准度进行评分,并根据评分给出异常标签值,进行标签绑定算法的参数优化和逻辑优化
所述实体与数据集进行绑定的过程包括内容如下:
所述实体对应的数据集包含多个不同维度的数据表,各数据表之间具有一定的关联关系,绑定时将相关数据表之间的关联关系进行指定。
所述构建实体画像任务的过程包括内容如下:
选中实体后,展示数据集下的详细字段列表;
根据需要批量选择字段,绑定字段与标签之间的输入关系,并指定标签的执行顺序和分组的统计顺序,构建实体标签任务,得到标签结果。
具体实现过程如下:
a)在画布中选择实体,在弹出的数据集列表中选择可用字段
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于济南慧天云海信息技术有限公司,未经济南慧天云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110476312.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置