[发明专利]一种业务数据处理方法以及业务数据处理系统的构建方法有效
申请号: | 202110759304.6 | 申请日: | 2021-07-05 |
公开(公告)号: | CN113256353B | 公开(公告)日: | 2022-04-22 |
发明(设计)人: | 周小羽 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q10/06 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;贾允 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 业务 数据处理 方法 以及 数据处理系统 构建 | ||
本公开关于一种业务数据处理方法以及业务数据处理系统的构建方法,该方法包括:获取目标业务的用户画像数据和用户行为数据;针对所述目标业务的分析对象,从所述用户行为数据中确定出指示当前时间点的当前自变量数据和当前因变量数据,以及指示历史时间点的历史因变量数据;基于所述用户画像数据、所述当前自变量数据、所述当前因变量数据和所述历史因变量数据构建面板数据模型;利用所述面板数据模型确定所述历史因变量数据对所述当前因变量数据的影响程度值。本公开可以提高对分析对象进行分析的准确性,进而提高所提供的业务引导信息的准确性。所构建的业务数据处理系统,可以提高对较大数据量甚至海量的用户数据的分析效率。
技术领域
本公开涉及计算机技术,尤其涉及一种业务数据处理方法以及业务数据处理系统的构建方法。
背景技术
随着互联网技术的发展,出现了越来越多的互联网产品,这些互联网产品为用户提供了丰富的产品使用体验,比如观看短视频的体验、作为主播/观众参与直播的体验等等。为了更好分析的用户使用互联网产品的情况,在相关技术中,往往采集大量数据,然后基于分析对象对相关数据进行回归以得到因变量与自变量之间的关系。比如采集某互联网产品下大量的用户行为数据,再基于分析模型的回归模型来研究,例如,用户使用某互联网产品的时长(因变量)和用户的评论区行为数据(自变量)之间的关系。然而,一些自变量在短时间上常是高度自相关的,基于此会高估这样的自变量对因变量的影响程度,造成回归结果有偏,从而为优化当前互联网产品或者开发新的互联网产品提供不准确的业务引导信息。因此,上述相关技术的方案存在不能准确有效的对分析对象进行分析以及不能提供准确有效的业务引导信息的问题。
发明内容
本公开提供一种业务数据处理方法以及业务数据处理系统的构建方法,以至少解决相关技术中存在不能准确有效的对分析对象进行分析以及不能提供准确有效的业务引导信息的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种业务数据处理方法,所述方法包括:
获取目标业务的用户画像数据和用户行为数据;
针对所述目标业务的分析对象,从所述用户行为数据中确定出指示当前时间点的当前自变量数据和当前因变量数据,以及指示历史时间点的历史因变量数据;
基于所述用户画像数据、所述当前自变量数据、所述当前因变量数据和所述历史因变量数据构建面板数据模型;
利用所述面板数据模型确定所述历史因变量数据对所述当前因变量数据的影响程度值。
在一示例性的实施方式中,所述基于所述用户画像数据、所述当前自变量数据、所述当前因变量数据和所述历史因变量数据构建面板数据模型,包括:
确定所述用户画像数据对应的固定效应值;
确定指示所述当前时间点的误差项;
基于所述固定效应值、所述误差项、所述当前自变量数据、所述当前因变量数据和所述历史因变量数据构建所述面板数据模型。
在一示例性的实施方式中,所述利用所述面板数据模型确定所述历史因变量数据对所述当前因变量数据的影响程度值,包括:
对所述面板数据模型进行时间维度的一阶差分处理;
基于一阶差分处理结果确定与所述历史因变量数据具有预设相关度的工具变量;
利用所述工具变量对所述面板数据模型进行回归处理,得到所述历史因变量数据对所述当前因变量数据的影响程度值。
在一示例性的实施方式中,所述利用所述工具变量对所述面板数据模型进行回归处理,得到所述历史因变量数据对所述当前因变量数据的影响程度值,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110759304.6/2.html,转载请声明来源钻瓜专利网。