[发明专利]用户画像的配置方法、装置、计算机设备及介质有效
| 申请号: | 202111402220.3 | 申请日: | 2021-11-19 |
| 公开(公告)号: | CN114021175B | 公开(公告)日: | 2022-08-02 |
| 发明(设计)人: | 吴昊;杨振燕;王志辉;周才军;罗燕武;陈培杰;曾依峰;宁海亮;樊鹏辉;雷家庆 | 申请(专利权)人: | 深圳市电子商务安全证书管理有限公司 |
| 主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/64;G06K9/62;G06N20/00 |
| 代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉 |
| 地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 画像 配置 方法 装置 计算机 设备 介质 | ||
本申请涉及用户画像领域,揭示了一种用户画像的配置方法、装置、计算机设备及存储介质,方法包括:获取用户在若干个不同平台的基础数据及对应平台的平台标识;获取用户的用户标识,建立所述基础数据与所述用户标识及对应平台的平台标识的关联关系;根据所述关联关系基于机器学习模型分别计算用户在每个所述平台标识下的所述基础数据,得到用户在每一个平台下的属性标签;对所述属性标签进行同态加密,得到密文标签;获取所述属性标签的类型,根据所述属性标签的类型配置所述密文标签的授权信息,并根据所述密文标签及所述授权信息生成用户画像。本申请能够提高数据的安全性及提高密文标签转化为用户画像的效率。
技术领域
本申请涉及到用户画像领域,特别是涉及到一种用户画像的配置方法、装置、计算机设备及存储介质。
背景技术
随着互联网技术的发展,目前互联网上对于用户画像的处理,是通过统计用户的行为数据,然后识别用户的行为数据从而得到表征用户画像的不同标签,而对于不同平台采集的数据,没有额外地进行数据管理与权限控制,数据的泄露风险较大,且用户画像的配置过程数据安全性低、效率低。
发明内容
本申请的主要目的为提供一种用户画像的配置方法、装置、计算机设备及存储介质,旨在解决目前不同平台下的用户画像的配置过程安全性低、效率低的问题。
为了实现上述发明目的,本申请提出一种用户画像的配置方法,包括:
获取用户在若干个不同平台的基础数据及对应平台的平台标识;
获取用户的用户标识,建立所述基础数据与所述用户标识及对应平台的平台标识的关联关系;
根据所述关联关系基于机器学习模型分别计算用户在每个所述平台标识下的所述基础数据,得到用户在每一个平台下的属性标签;
对所述属性标签进行同态加密,得到密文标签;
获取所述属性标签的类型,根据所述属性标签的类型配置所述密文标签的授权信息,并根据所述密文标签及所述授权信息生成用户画像。
进一步地,所述将所述第一单词基于预建立的同义词表转化为相同语义的第二单词,根据所述第一样本数据与所述第二单词生成第二样本数据,包括:
选取所述第一样本数据中的任意一个单词作为第一单词;
基于预建立的同义词表为所述第一单词匹配相同语义的第二单词;
将所述第一样本数据的第一单词替换为所述第二单词,生成第二样本数据。
进一步地,所述获取所述第一单词中使用频率满足预设值的第三单词之前,还包括:
获取所述第一样本数据的应用场景;
获取基于大数据预采集的所述应用场景下的单词库;
从所述单词库中确定所述应用场景下频率的预设值。
进一步地,所述生成意图识别模型的训练样本数据之后,还包括:
获取所述训练样本数据的意图;
统计各个意图的训练样本数据的数据量;
获取所述训练样本数据的数据量低于预设阈值的目标意图,对所述目标意图进行训练样本数据增强。
进一步地,所述对所述目标意图进行训练样本数据增强,包括:
获取所述目标意图的待增强样本数据;
对所述待增强样本数据的词语的进行顺序变换,生成目标样本数据,以对所述目标意图进行训练样本数据增强。
进一步地,所述对所述目标意图进行训练样本数据增强,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市电子商务安全证书管理有限公司,未经深圳市电子商务安全证书管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111402220.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:二拖一燃气-蒸汽联合循环机组及解汽方法
- 下一篇:一种无抗鸡饲料的制备方法





