[发明专利]数据库用户数据处理方法和装置有效
申请号: | 201610190985.8 | 申请日: | 2016-03-30 |
公开(公告)号: | CN105677925B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 刘朋飞;王晓;李爱华 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F7/24 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 曹蓓 |
地址: | 100080 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据库 用户 数据处理 方法 装置 | ||
本发明提出一种数据库用户数据处理方法和装置,涉及数据挖掘领域。其中,本发明的数据库用户数据处理方法包括:选定用户数据中多个预定特征,预定特征包括正向特征和逆向特征;根据预定特征的数据获取正向化数据;标准化处理预定特征的正向化数据,获取标准化数据;根据多个预定特征的权重,基于预定特征的标准化数据确定用户排序参数;按照用户排序参数对用户进行排序,获得排序用户列表。通过这样的方法,能够基于预定特征对应的权重对用户预定特征的数据进行运算,生成用户排序参数,并按照用户排序参数的大小排序。这样的数据处理方式运算量小,效率高,且能够根据用户数据对用户进行更加客观的排序和评价。
技术领域
本发明涉及数据挖掘技术领域,特别涉及一种数据库用户数据处理方法和装置。
背景技术
数据库是按照数据结构来组织、存储和管理数据的仓库,在日常信息管理中,往往需要数据库来存储数据,特别是在数据量较大时,需要使用数据库来存储和维护数据。在数据库中可以存储多种数据,例如用户数据、系统数据、员工数据等。
针对数据库中存储的海量数据进行挖掘分析往往能够获得非常有价值的信息,目前,在数据挖掘技术领域,操作人员可以通过特征词匹配的方式进行排查、监控,或是提取数据进行计算处理寻找规律。但是,由于数据库中存储的数据特征繁多,且数量庞大,这样的数据挖掘方式一方面需要计算量颇大的关键词检索匹配或大量的数据分析,效率低且对运算设备的要求高;另一方面,数据挖掘的结果在一定程度上依赖于操作者配置的关键词和参数,以及操作者的经验,具有一定主观性,使得数据挖掘结果不够准确。如何使数据挖掘结果更准确、客观地体现数据本身特点和规律,是数据挖掘技术领域的一个课题。
发明内容
本发明的一个目的在于提出一种客观高效的数据挖掘方案。
根据本发明的一个方面,提出一种数据库用户数据处理方法,包括:选定用户数据中多个预定特征,预定特征包括正向特征和逆向特征;根据预定特征的数据获取预定特征的正向化数据,正向化数据包括正向特征的数据和将正向化处理后的逆向特征的数据;标准化处理预定特征的正向化数据,获取预定特征的标准化数据;根据多个预定特征的权重基于预定特征的标准化数据确定用户排序参数;按照用户排序参数对用户进行排序,获得排序用户列表。
可选地,对逆向特征的数据进行正向化处理包括:获取逆向特征的数据的最大值;将逆向特征的数据的最大值减去逆向特征的数据,确定逆向特征的正向化数据。
可选地,标准化处理预定特征的正向化数据获取预定特征的标准化数据包括:采用离差标准化的方式标准化处理预定特征的正向化数据,获取预定特征的标准化数据。
可选地,还包括:根据用户排序参数分位数个数对排序用户列表分组,获得分组排序用户列表。
可选地,预定特征包括:用户首次记录到统计日期的时间长度、用户最近一次记录到统计日期的时间长度、用户在预定时间内的记录频率、用户在预定时间内的记录数据总和,以及用户在预定时间内的记录数据总和占标准数据总和的比例。
通过这样的方法,能够基于预定特征对应的权重对用户预定特征的数据进行运算,生成用户排序参数,并按照用户排序参数的大小排序。这样的数据处理方式运算量小,效率高,且能够根据用户数据对用户进行客观的排序。
根据本发明的另一个方面,提出一种数据库用户数据处理方法,包括:选定用户数据中多个预定特征,预定特征包括正向特征和逆向特征;确定预定特征的分位数个数,根据分位数个数确定预定特征的用户分类阈值;基于每个预定特征的用户分类阈值分类,获得多特征分类用户集合。
可选地,确定预定特征的分位数个数,根据分位数个数确定预定特征的用户分类阈值包括:将预定特征的数据进行排序;根据预定特征的分位数个数将数据等分,确定分割点的数据为预定特征的用户分类阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610190985.8/2.html,转载请声明来源钻瓜专利网。