[发明专利]一种用户标签处理方法、装置和电子设备在审
申请号: | 202110763069.X | 申请日: | 2021-07-06 |
公开(公告)号: | CN113569919A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 唐洋洋 | 申请(专利权)人: | 上海淇玥信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q30/02 |
代理公司: | 上海点威知识产权代理有限公司 31326 | 代理人: | 杜焱 |
地址: | 200333 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用户 标签 处理 方法 装置 电子设备 | ||
本说明书实施例提供一种用户标签处理方法,获取用作训练样本的用户资信数据,根据其是否携带有标签进行分为正标签用户资信数据和待打标用户资信数据,在正标签用户资信数据中确定辅助用户资信数据,将其划分至待打标用户资信数据类别中,训练标签预测第一模型,对辅助用户资信数据进行预测,确定预测值,设置模型阈值,并结合模型阈值训练标签预测第二模型,用其对新获取的用户资信数据进行标签预测。通过将部分正标签用户作为辅助用户先训练标签预测第一模型,那么,辅助用户对应的预测值能够一定程度表明该模型遗漏的正样本用户的模型阈值,那么,根据这个模型阈值再去训练标签预测第二模型,用它便能提高打标准确率,挽回漏掉的用户。
技术领域
本申请涉及计算机领域,尤其涉及一种用户标签处理方法、装置和电子设备。
背景技术
我们在进行客户管理时,常常会根据客户的资信数据对客户打上标签,以便后续进行客群的划分等。
在对用户打标时,多是利用模型进行预测,这种用于预测的模型通常是借助正样本和负样本进行训练得到的,然而,现实中我们接触到的大部分数据实际上是正样本及未标注的负样本,这是因为获取负类样本较为困难、负类数据太过多样化且动态变化,很难得到较好的训练效果。这就使得如果寄希望于收集负样本进行模型训练继而进行打标,就会出现样本过少打标的准确率低的问题。
因此,有必要提供一种新的处理方法。
发明内容
本说明书实施例提供一种用户标签处理方法、装置和电子设备,用以提高准确率。
本说明书实施例还提供一种用户标签处理方法,包括:
获取用作训练样本的用户资信数据,根据用户资信数据是否携带有标签进行分类,分为正标签用户资信数据和待打标用户资信数据;
在所述正标签用户资信数据中确定辅助用户资信数据,将其划分至待打标用户资信数据类别中;
利用所述用户资信数据训练标签预测第一模型;
利用所述标签预测第一模型对待打标用户资信数据类别中的辅助用户资信数据进行预测,确定预测值,根据预测值设置模型阈值,并结合所述模型阈值训练标签预测第二模型,用标签预测第二模型对新获取的用户资信数据进行标签预测。
可选地,所述标签为是否具有公积金账户。
可选地,还包括:
在对新获取的用户资信数据进行标签预测后,对预测出的正标签用户进行召回。
可选地,还包括:
将召回的正标签用户划分至相应的客群中。
可选地,所述利用所述用户资信数据训练标签预测第一模型,包括:
以半监督学习的方式,利用所述用户资信数据训练标签预测第一模型。
可选地,所述标签预测第二模型为二分类模型,所述二分类模型中具有一个由多个分类器集成形成的二分类器。
可选地,所述根据预测值设置模型阈值,包括:
根据多个预测值中最小值设置模型中用于判定负标签的阈值下限。
本说明书实施例还提供一种用户标签处理装置,包括:
数据处理模块,用于获取用作训练样本的用户资信数据,根据用户资信数据是否携带有标签进行分类,分为正标签用户资信数据和待打标用户资信数据;
在所述正标签用户资信数据中确定辅助用户资信数据,将其划分至待打标用户资信数据类别中;
模型模块,用于利用所述用户资信数据训练标签预测第一模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇玥信息技术有限公司,未经上海淇玥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110763069.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:驱动电路及其驱动芯片
- 下一篇:一种智能座舱控制系统