[发明专利]一种确定用户身份的方法在审
| 申请号: | 201410855473.X | 申请日: | 2014-12-31 |
| 公开(公告)号: | CN104615658A | 公开(公告)日: | 2015-05-13 |
| 发明(设计)人: | 涂继业;张涌;宁立 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 深圳市铭粤知识产权代理有限公司 44304 | 代理人: | 孙伟峰 |
| 地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 确定 用户 身份 方法 | ||
技术领域
本发明涉及海量计算机数据处理技术,尤其涉及一种基于日志数据确定用户身份的方法。
背景技术
现有的用户身份识别方主要有两种:一种是由业务员手动式确定用户的身份,业务员从相互合作的业务伙伴手中直接拿到身份数据,构成身份数据库;另一种是由用户自主选择确定身份,设置若干身份选项,然后,在用户使用产品前引导用户自主选择一个身份。
这两种方法都存在明显的缺点和不足。业务员手动式确定身份方法效率十分低下,当用户量增加到很大量级后单单依靠手工完成身份确认,也不再可能;而且由于往往存在一个账户多个人同时使用的情况,依靠业务员只能够确定其中的一个,无法自动发现其他子账户,造成身份确认不全面;另外,手动式确认方法对于身份数据的更新十分困难,每次用户身份发生变化都需要业务员及时修改,时效性很差。用户自主选择身份的方法同样也存在诸多缺点,该方法的用户的参与度较低,很多用户不愿意确认自己的身份;其二是数据可信度差,用户往往出于自我保护的心态而虚报身份。
因此现有技术还存在缺陷,亟待改进。
发明内容
为克服现有技术的不足,本发明提供一种确定用户身份的方法。
根据本发明的一方面,提供一种确定用户身份的方法,所述方法包括:获取与用户操作相关的日志数据;根据获取的日志数据,确定每个用户的操作特征;根据操作特征对用户划分群组,其中,将操作特征相同或者相似的用户划分至同一组群;获取每个组群中的一个用户的身份;将所述一个用户的身份确定为所述一个用户所在的组群的用户所属的身份。
优选地,所述与用户操作相关的日志数据至少包括以下信息:用户的标识、用户的操作类型、用户的操作标识以及用户的操作时间。
优选地,所述确定每个用户的操作特征的步骤包括:从获取的日志数据中,提取每个用户的操作信息;基于提取的操作信息,构建每个用户的操作的有向图;从构建的有向图中,提取每个用户的操作的有向图的特征;将提取的每个用户的操作的有向图的特征确定为每个用户的操作特征。
优选地,所述构建每个用户的操作的有向图的步骤包括:针对同一用户确定与提取的操作信息对应的节点;将操作上存在预定的先后执行关系的两个节点之间的连线确定为有向边,并且该有向边的操作时间较早的节点指向该有向边的操作时间较晚的节点;基于确定的节点以及有向边,构建该用户的操作的有向图。
优选地,当任意两个节点之间的操作时间间隔不大于第一阈值时,确定所述两个节点之间的操作存在预定的先后执行关系。
优选地,所述有向图的特征至少包括以下信息之一:有向图的出度、有向图的入度、有向图的边数以及有向图的节点个数。
优选地,所述将操作特征相同或者相似的用户划分至同一组群的步骤包括:采用聚类分析的方法,将操作特征相同或者相似的用户划分至同一组群。
优选地,所述聚类分析的方法为KMeans算法。
优选地,所述方法还包括:通过预定的报表形式,显示划分的各个组群的用户所属的身份及划分的各个组群所占的用户比例。
本发明不仅克服了手动确定身份的效率低下、辨别度低、更新困难等缺点,而且还弥补了用户自主选择身份方法的参与度低、可信度差的缺点。
附图说明
图1是示出根据本发明的示例性实施例的确定用户身份的方法的流程图;
图2是示出根据本发明的示例性实施例的某用户的操作的有向图的模型示意图;
图3是示出根据本发明的示例性实施例的划分的各个组群的聚类示意图。
具体实施方式
以下,参照附图来详细说明本发明的实施例。
图1示出了本发明一种确定用户身份的方法的优选实施例的流程图。
参照图1,在步骤110中,获取与用户操作相关的日志数据。
通常,在各种设备中运行的日志除了记录有各种类型的错误(error)、警告(warning)、通知(info)、调试(debug)、网络地址(IP)、统一资源定位符(URL)、客户端类型、线程号、文件名、行号、函数名等信息之外,还可能记录有与用户操作有关的各种信息,例如,用户的标识(ID)、用户的操作类型、用户的操作标识(ID)以及用户的操作时间。
为了对各种用户的行为进行数据分析,可通过获取与用户操作相关的日志数据,来获取用户的操作信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410855473.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种处理数据的方法、装置及终端设备
- 下一篇:一种辅助记录的组织方法





