[发明专利]一种模型训练方法、业务分配方法、装置及设备在审
申请号: | 202110603499.5 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113344066A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 陈李龙;王娜;倪俊;徐林嘉 | 申请(专利权)人: | 中国工商银行股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 任默闻;王涛 |
地址: | 100140 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 业务 分配 装置 设备 | ||
1.一种基于用户分类的模型训练方法,其特征在于,包括:
获取用户样本数据;所述用户样本数据包括有标签数据和无标签数据;所述有标签数据对应有用户类别;
将所述用户样本数据划分为分别对应于至少两种业务处理视角的单视角数据;所述业务处理视角用于指示数据的不同类别;
针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果;
根据所述数据聚类结果构造关联约束系数;所述关联约束系数用于调节各个业务处理视角下的单视角数据的训练结果的相似性;
基于所述用户样本数据确定平滑约束系数;所述平滑约束系数用于调节有标签数据和无标签数据的训练结果的相似性;
综合所述关联约束系数和平滑约束系数训练得到用户分类模型;所述用户分类模型用于根据用户数据确定用户类别。
2.如权利要求1所述的方法,其特征在于,所述获取用户样本数据,包括:
从用户样本数据对应的样本用户中选取标注用户;
获取所述标注用户的历史业务记录;
根据所述历史业务记录为所述标注用户设置用户类别;所述用户类别对应于所述标注用户的用户样本数据。
3.如权利要求1所述的方法,其特征在于,所述业务处理视角,包括基本信息视角、资产信息视角、持有信息视角和行为信息视角中的至少一种。
4.如权利要求1所述的方法,其特征在于,所述业务处理视角分别对应有至少两种数据特征;所述数据特征用于表述数据的不同类别;所述将所述用户数据划分为分别对应于至少两种业务处理视角的单视角数据之后,还包括:
确定所述单视角数据下对应于不同数据特征的特征数据;
相应的,所述针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果,包括:
结合所述特征数据对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果。
5.如权利要求1所述的方法,其特征在于,所述针对各组单视角数据分别进行聚类,得到各个业务处理视角下的数据聚类结果,包括:
获取各个业务处理视角下单视角数据之间的相似关系;
基于所述相似关系构建加权关联矩阵;所述加权关联矩阵,用于表示各个业务处理视角下数据的聚类结果。
6.如权利要求5所述的方法,其特征在于,所述获取各个业务处理视角下单视角数据之间的相似关系,包括:
利用公式计算相似关系,式中,s(i,j)表示单视角数据xi与单视角数据xj之间的相似关系,V表示业务处理视角的个数,Kv表示第v个业务处理视角下聚簇的个数,I(xi,xj)(v,k)为单视角数据xi与单视角数据xj第v个业务处理视角下第k个聚簇中的相关性函数,其中,是第v个视角的第k个聚簇,为单视角数据xi与单视角数据xj第v个业务处理视角下第k个聚簇中的簇内密度系数,其中,为聚簇中单视角数据的个数,为单视角数据xi和xj在聚簇中的距离,为聚簇中单视角数据的均值,
7.如权利要求1所述的方法,其特征在于,所述根据所述数据聚类结果构造关联约束系数,包括:
利用公式计算关联约束系数,式中,Rsim为关联约束系数,|L|为有标签数据的个数,|U|为无标签数据的个数,f(x)为预先设置的用户分类模型,s(i,j)为单视角数据xi与xj的关联关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110603499.5/1.html,转载请声明来源钻瓜专利网。