[发明专利]客户聚类系统及其方法有效
| 申请号: | 202010252223.2 | 申请日: | 2020-04-01 |
| 公开(公告)号: | CN111461225B | 公开(公告)日: | 2022-04-01 |
| 发明(设计)人: | 李怀松;陈永环 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
| 主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/74;G06N3/04;G06N3/08 |
| 代理公司: | 上海一平知识产权代理有限公司 31266 | 代理人: | 竺云;须一平 |
| 地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 客户 系统 及其 方法 | ||
1.一种客户聚类系统,包括:
样本特征层,用于获得训练样本的特征向量,其中,根据所述训练样本的特征向量构成第一矩阵,其中,横轴是客户数N,纵轴是特征维度,以及一个N维的类标签向量Y;
编码层,使用包含注意力机制的神经网络模型实现,用于对所述样本的特征向量进行编码,其中,通过注意力机制获得表示每个训练样本与其它训练样本间的第一相似度的第二矩阵,然后将所述第二矩阵与对应的值矩阵相乘,获得含有每个训练样本与其它训练样本件间的相似度关系的第三矩阵,其中,第三矩阵中的特征向量含有每个训练样本与其它训练样本件间的相似度关系;
相似度计算层,用于根据所述编码层输出的所述样本的特征向量的编码计算各样本两两之间的相似度,其中,相似度计算层通过将第三矩阵对应的第三查询矩阵与第三键矩阵转置相乘,并通过sigmoid变换,获得第四矩阵,第四矩阵用于表示每个训练样本与其它训练样本间的第二相似度;
聚类划分层,用于根据所述各样本两两之间的相似度进行聚类划分,其中将相似度大于预定阈值的两个样本归于一类;
其中,所述特征是以下之一或它们的任意组合:客户年龄、客户性别、客户是否结婚、客户一个月的流入金额、客户一个月的流出金额、客户住址、客户职业、客户所在地域、业务类型;并且,
所述聚类系统还包括损失函数计算层,用于基于所述相似度计算层输出的各训练样本两两之间的相似度和所述各训练样本之间已知的真实相似度,计算损失函数,所述损失函数用于对所述神经网络模型的参数进行更新,其中,损失函数计算层根据所述训练样本对应的真实的类的标签,获得表示每个训练样本与其它训练样本间的真实相似度的第五矩阵,其中,所述第五矩阵的每一行表示当前训练样本,每行中的每列则表示当前训练样本的真实的类与其它训练样本的真实的类是否属于同一类,其中,每个训练样本可以与多个其它训练样本属于同一类,并且,损失函数计算层获得所述第四矩阵,并且,损失函数是第四矩阵与第五矩阵的平方误差。
2.如权利要求1所述的聚类系统,其中,所述包含注意力机制的神经网络模型是转换器Transformer。
3.如权利要求2所述的聚类系统,其中,所述编码层包括多个依次叠加的转换器Transformer。
4.如权利要求1所述的聚类系统,其中,所述样本特征层还用于根据应用场景相应的清洗规则,筛选出满足条件的训练样本。
5.如权利要求1所述的聚类系统,其中,所述样本特征层还用于获得每个所述训练样本对应的真实的类的标签;并且
所述损失函数计算层还用于根据所述训练样本对应的真实的类的标签,获得表示每个训练样本与其它训练样本间的真实相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010252223.2/1.html,转载请声明来源钻瓜专利网。





