[发明专利]用户访问的离散数据处理方法、装置、设备及介质在审
| 申请号: | 201911381085.1 | 申请日: | 2019-12-27 |
| 公开(公告)号: | CN111190940A | 公开(公告)日: | 2020-05-22 |
| 发明(设计)人: | 杜宇衡 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/26 |
| 代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 黄章辉 |
| 地址: | 518000 广东省深圳市福田*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用户 访问 离散 数据处理 方法 装置 设备 介质 | ||
1.一种用户访问的离散数据处理方法,其特征在于,包括:
自数据库中获取用户在预设时间段内访问的用户访问数据中的待处理离散数据;所述待处理离散数据是指所述预设时间段内不符合稳定性要求的用户访问数据;
通过包含划分参数的等频分箱法对所述待处理离散数据进行划分得到若干不同的第一数据区域,并获取每一个所述第一数据区域内的区域访问数据;所述区域访问数据中包含一个所述第一数据区域内的访问人数与所述预设时间段内的总访问人数之间的第一人数占比;
确定位于所述预设时间段之前且与所述预设时间段连续等长的历史时间段,并获取所述历史时间段内的历史离散数据,并通过包含所述划分参数的等频分箱法对所述历史离散数据进行划分得到若干不同的第二数据区域,并获取每一个所述第二数据区域内的访问人数与所述历史时间段内的总访问人数之间的第二人数占比;其中,所述历史离散数据是指所述历史时间段内不符合稳定性要求的用户访问数据;
根据所述第一人数占比和所述第二人数占比获取每一个所述第一数据区域的群体稳定指标值;
根据所述预设时间段内的所有所述第一数据区域的所述区域访问数据,获取每一个所述第一数据区域的相对命中率和信息量值;
将每一个所述第一数据区域的所述第一人数占比、所述群体稳定指标值、所述相对命中率、所述信息量值输入预设评估函数,以获取每一个所述第一数据区域的总评分值,并根据所述总评分值确定所述待处理离散数据中的价值区域,以供根据所述价值区域确定用户维护措施。
2.如权利要求1所述的用户访问的离散数据处理方法,其特征在于,所述根据所述第一人数占比和所述第二人数占比获取每一所述第一数据区域的群体稳定指标值,包括:
将所述第一人数占比和所述第二人数占比输入以下稳定指标计算模型中,以获取每一所述第一数据区域的群体稳定指标值:
Zi=(Xi-Li)×ln(Xi/Li)
其中:
Zi为第i个所述第一数据区域的群体稳定指标值;
Xi为第i个所述第一数据区域的所述第一人数占比;
Li为第i个所述第一数据区域的所述第二人数占比。
3.如权利要求1所述的用户访问的离散数据处理方法,其特征在于,每一个所述第一数据区域的所述区域访问数据中包含符合命中要求的用户访问数据以及不符合命中要求的用户访问数据;
所述根据所述预设时间段内的所有所述第一数据区域的所述区域访问数据,获取每一个所述第一数据区域的相对命中率,包括:
将所述预设时间段内的所有所述第一数据区域的所述区域访问数据输入以下命中率计算模型中,以获取每一个所述第一数据区域的相对命中率:
Ai=(Pi-PT)/PT
其中:
Ai为第i个所述第一数据区域的相对命中率;
Pi为第i个所述第一数据区域中所有符合命中要求的用户访问数据在该第一数据区域中的所有用户访问数据中所占的百分比;
PT为所有所述第一数据区域中所有符合命中要求的用户访问数据在所有所述第一数据区域中的用户访问数据中所占的百分比。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911381085.1/1.html,转载请声明来源钻瓜专利网。





