[发明专利]同人识别方法及装置、存储介质、计算机设备有效

申请号：	201910740557.1	申请日：	2019-08-12
公开（公告）号：	CN110533085B	公开（公告）日：	2022-04-01
发明（设计）人：	刘逸哲	申请（专利权）人：	大箴(杭州)科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京中强智尚知识产权代理有限公司 11448	代理人：	黄耀威;贾依娇
地址：	310011 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	同人识别方法装置存储介质计算机设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种同人识别方法及装置、存储介质、计算机设备，该方法包括：基于样本用户的特征信息对所述样本用户进行聚类，得到至少一个样本用户簇；分别从每个所述样本用户簇中提取至少一组训练样本用户，并获取所述训练样本用户的同人标注信息；利用所述训练样本用户以及相应的所述同人标注信息，训练同人识别模型；根据训练后的所述同人识别模型对待识别用户进行同人识别。本申请通过对样本用户的聚类，减少同人识别模型的训练量，实现了训练的优化，提升训练效率。

技术领域

本申请涉及数据分析技术领域，尤其是涉及到一种同人识别方法及装置、存储介质、计算机设备。

背景技术

当前互联网蓬勃发展，催生出一批电商及网络金融服务公司，由于电商公司会有各种新人补贴，金融服务公司会直接借款给用户，都导致很多用户更换手机号，重新注册等手段获取利益，因此，如何确定网站注册用户，或者服务对象是同一个人，成为电商及互联网金融服务公司降低运营成本和风险的关键。

在同人识别领域中，训练样本的构建对训练同人识别模型至关重要。如何从大量的样本用户中快速确定哪两个用户属于同一个用户，进而构建训练样本集是该领域中的重要问题。

发明内容

有鉴于此，本申请提供了一种同人识别方法及装置、存储介质、计算机设备，通过对样本用户的聚类，减少同人识别模型的训练量，实现了训练的优化，提升训练效率。

根据本申请的一个方面，提供了一种同人识别方法，包括：

基于样本用户的特征信息对所述样本用户进行聚类，得到至少一个样本用户簇；

分别从每个所述样本用户簇中提取至少一组训练样本用户，并获取所述训练样本用户的同人标注信息；

利用所述训练样本用户以及相应的所述同人标注信息，训练同人识别模型；

根据训练后的所述同人识别模型对待识别用户进行同人识别。