[发明专利]基于AI和流式计算的用户分析方法及系统在审
申请号: | 202211516603.8 | 申请日: | 2022-11-30 |
公开(公告)号: | CN115687732A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 王国华;姚锦权;邢祎哲 | 申请(专利权)人: | 杭银消费金融股份有限公司 |
主分类号: | G06F16/951 | 分类号: | G06F16/951;G06F16/9535;G06N3/08;G06F18/214 |
代理公司: | 浙江维创盈嘉专利代理有限公司 33477 | 代理人: | 龚洋洋 |
地址: | 310005 浙江省杭州市拱墅区庆春路38号7层702室、*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ai 计算 用户 分析 方法 系统 | ||
1.一种基于AI和流式计算的用户分析方法,其特征在于,应用于用户分析AI系统,所述方法包括:
接收目标用户对应的终端设备上传的所述目标用户的流式数据,依据所述流式数据的产生时序进行归集,得到拟分析流式数据事件集;其中,所述拟分析流式数据事件集中的数据时间跨度为预设的时间跨度;
获取所述拟分析流式数据事件集对应的流式数据组链;
依据调试完成的目标事件识别网络按序对所述流式数据组链中的每一流式数据组进行目标事件识别,获得所述流式数据组链中存在目标事件数据的目标流式数据组以及所述目标流式数据组中目标事件数据的事件分布;
针对所述拟分析流式数据事件集中在采集时间上紧邻的所述目标流式数据组,依据目标事件数据的事件分布的匹配性进行分桶,得到多个在采集时间上紧邻的目标流式数据序列;
输出所述多个在采集时间上紧邻的目标流式数据序列分别在所述拟分析流式数据事件集中的时序分布情况以及所述目标事件数据的事件分布。
2.根据权利要求1所述的方法,其特征在于,所述获取所述拟分析流式数据事件集对应的流式数据组链,包括:
获取所述拟分析流式数据事件集,将所述拟分析流式数据事件集按所述拟分析流式数据事件集的流式数据组容量进行分离,得到多个流式数据分团;
在每一所述流式数据分团中依据预设的挖掘频率进行数据采样,得到预设数目的流式数据组;
依据在每一流式数据分团得到的预设数目的流式数据组,得到所述流式数据组链。
3.根据权利要求1所述的方法,其特征在于,所述依据调试完成的目标事件识别网络按序对所述流式数据组链中的每一流式数据组进行目标事件识别,包括:
将所述流式数据组链中的多个所述流式数据组按序加载至所述调试完成的目标事件识别网络;
依据所述目标事件识别网络的表征向量挖掘模块,挖掘所述流式数据组对应的表征向量集合;
依据所述目标事件识别网络的事件分类模块,依据所述流式数据组的表征向量集合,获得所述表征向量集合中的每一表征向量的类型和概率变量;
所述获得所述流式数据组链中存在目标事件数据的目标流式数据组以及所述目标流式数据组中目标事件数据的事件分布,包括:
获取所述事件分类模块输出的所述表征向量集合中的每一表征向量的类型和概率变量;
依据所述表征向量集合的各个表征向量对应的数据区间为目标事件数据的概率变量,以及各个表征向量对应的预估临时窗口的预估事件分布,确定所述流式数据组的目标事件数据识别结果;其中,所述目标事件数据识别结果包括所述流式数据组中是否包括目标事件数据以及所述目标事件数据的事件分布;
依据所述流式数据组链中的每一流式数据组的目标事件数据识别结果,获得所述流式数据组链中存在目标事件数据的目标流式数据组以及所述目标流式数据组中目标事件数据的事件分布。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取用于调试目标事件识别网络的标记调试模板集合;
依据所述标记调试模板集合中的每一个标记调试模板的标记指示信息,确定所述标记调试模板中目标事件数据的字段覆盖范围;
对所述标记调试模板中目标事件数据的字段覆盖范围进行分桶,得到多个分桶质心;
将所述分桶质心表征的字段覆盖范围确定为调试所述目标事件识别网络的外部参变量,然后通过所述标记调试模板对所述目标事件识别网络进行有监督的调试。
5.根据权利要求1所述的方法,其特征在于,用于调试所述目标事件识别网络的标记调试模板通过如下步骤获取得到:
获取多个流式数据事件调试集;
针对每个所述流式数据事件调试集,在所述流式数据事件调试集的第一个流式数据组开始搜寻,当搜寻到的流式数据组和相邻流式数据组相异时,将所述搜寻到的流式数据组添加到拟标记调试模板集合;当所述搜寻到的流式数据组和相邻流式数据组相似时,跳过所述搜寻到的流式数据组直到所述流式数据事件调试集的流式数据组全部完成搜寻;
依据所述多个流式数据事件调试集搜寻结束后得到的拟标记调试模板集合,确定用于调试目标事件识别网络的标记调试模板集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭银消费金融股份有限公司,未经杭银消费金融股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211516603.8/1.html,转载请声明来源钻瓜专利网。