[发明专利]一种计算机系统及其用户的身份识别方法和装置在审
| 申请号: | 201810206073.4 | 申请日: | 2018-03-13 |
| 公开(公告)号: | CN108200101A | 公开(公告)日: | 2018-06-22 |
| 发明(设计)人: | 卫娟;戚新波;于琨;刘丹;王崇科 | 申请(专利权)人: | 河南工学院 |
| 主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/08 |
| 代理公司: | 西安铭泽知识产权代理事务所(普通合伙) 61223 | 代理人: | 韩晓娟 |
| 地址: | 453003 *** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 相似用户 计算机系统 方法和装置 身份识别 用户身份 裁剪 计算机技术领域 采集 准确度 时间特征 网络访问 详细信息 信息损失 用户信息 时间点 日志 入网 外泄 网站 计算机网络 个性 身份 | ||
1.一种计算机系统及其用户的身份识别方法,其特征在于:该方法的具体步骤如下:
S1:采集用户在某个时间点对计算机系统中的某个URL请求的详细信息;
S2:对采集的数据中涉及的大量用户进行相似用户集挑选,缩小相似用户的范围;
S3:基于用户经常访问的网站个数比例进行相似度计算,而在用户经常访问的网站中,有些网站是其他用户经常访问的门户网站,而有些网站只有某几个用户访问的个性化网站,通过这种个性化网站代表用户的网络访问行为特征,并对基于个性化网站的相似度用户集进行剪裁计算;
S4:在每一个用户的整体上网时间方面,用一个24维的向量h=(h1,h2,…,h24)表示用户的上网时间特征,其中hi表示第(i-1)h到第ih该用户的网络访问天数,若在第(i-1)h到第ih内至少有20min有URL请求的发送,则给hi累加1,以上网时间相似度0.69为标准,采用余弦相似度的计算方法,将新用户v的相似度用户集SimiUsers(v)中所有和新用户v的上网时间相似度≤0.69的用户全部过滤;
S5:若|SimiUsers(v)|=0,则判断用户v为新入网用户,若|SimiUsers(v)|=1,则直接将该用户作为与用户v具有相同身份的用户而返回,若|SimiUsers(v)|>1,则需要进一步从用户集中挑选与用户v最相似的用户作为相同身份的用户。
2.根据权利要求1所述的一种计算机系统及其用户的身份识别方法,其特征在于:所述步骤S1中,在具体的对用户访问请求的信息进行数据采集时,首先从庞大的原始数据中提取URL以及访问时间,随后将提取后的日志文件进行压缩。
3.根据权利要求1所述的一种计算机系统及其用户的身份识别方法,其特征在于:所述步骤S2中,采用下式作为两用户相似度的衡量标准,即式中,D(v)和D(ui)分别代表新入网用户v和已知用户库U中的用户ui在一定时间内经常访问的网站集合,将用户经常访问的网站定义为网站访问天数占上网天数80%以上的网站,当simiOne(v,ui)的阈值大于0.6时,便将ui加入SimiUsers(v)这一与用户v相似的用户集中。
4.根据权利要求1所述的一种计算机系统及其用户的身份识别方法,其特征在于:所述步骤S3中,通过个性化网站的权重计算两个用户的相似度,即:d∈D(v)∩D(ui),其中V(d)为访问过域名d的用户总数,由于访问用户越少的网站,个性化的程度越高,其权重也就越大,将网站的权重公式定义为所有访问用户数的倒数,可得到用户v和SimiUsers(v)中每个用户的新的相似度,根据这一相似度的计算结果倒序排序,并取5%比例的用户作为剪裁后的SimiUsers(v)用户集。
5.一种计算机系统及其用户的身份识别装置,其特征在于:包括数据采集模块、数据预处理模块、相似用户集挑选模块、个性化网站用户剪裁模块、时间特征用户集剪裁模块以及识别模块;
所述数据采集模块用于采集用户在网络系统中URL请求的详细信息,并上传至所述数据预处理模块中;
所述数据预处理模块用于对采集的用户数据进行压缩,压缩后的数据导入所述相似用户集挑选模块中;
所述相似用户集挑选模块采用杰卡德相似性度量的方式缩小相似用户的范围;
所述个性化网站用户剪裁模块用于对相似度用户集挑选后的用户集基于个性化网站权重计算两个用户的相似度;
所述时间特征用户集剪裁模块用于将新用户的相似度用户集中所有和用户上网时间相似度小于等于一个基准值的用户进行过滤;
所述识别模块用于新入网用户以及从用户集中挑选与原始用户最相似的用户作为相同身份的用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工学院,未经河南工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810206073.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网络安全态势评估系统
- 下一篇:一种基于屏幕字符识别的数据安全获取系统





