[发明专利]基于用户数据建模的分析方法、系统、介质及设备有效
| 申请号: | 202011250084.6 | 申请日: | 2020-11-11 |
| 公开(公告)号: | CN112070239B | 公开(公告)日: | 2021-07-09 |
| 发明(设计)人: | 薛颜波;蔡俊杰 | 申请(专利权)人: | 上海森亿医疗科技有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 徐秋平 |
| 地址: | 201213 上海市浦*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 用户 数据 建模 分析 方法 系统 介质 设备 | ||
本发明提供一种基于用户数据建模的分析方法、系统、介质及设备,所述基于用户数据建模的分析方法包括:对用户数据进行特征分析,生成特征分析结果;对所述特征分析结果进行随时间变化的稳定性检验,以检测异常数据,并根据异常数据检测结果判断所述特征分析结果是否可靠;将预处理数据对用户数据建模时所需的特征进行筛选;利用筛选后的特征进行用户数据建模,生成用户数据模型;对用户数据模型进行模型分析,以得到用户数据模型的可靠性分析结果。本发明在建模流程中,提供可靠的机器学习模型所需要的计算和分析环节,以实现完整的的自动化,并且提供给业务人员足够的分析信息,帮助业务人员诊断模型训练过程是否存在问题。
技术领域
本发明属于机器模型数据分析的技术领域,涉及一种用户数据建模的分析方法,特别是涉及一种基于用户数据建模的分析方法、系统、介质及设备。
背景技术
当前有一些自动化机器学习模型实验的系统,可以实现整个过程只需要配置参数,不需要太多人工的参与以及对机器学习底层原理的理解,也能完成建模工作。做到降低机器学习建模的专业门槛。例如阿里云提供的机器学习自动化服务,实现了数据预处理,算法建模(含自动调参),模型评估等环节的自动化工作。
但是,目前的auto-ml(Automated Machine Learning,自动机器学习)工具对于生产一个可靠的机器学习模型,流程和环节上存在很多缺失和不足。凭借现有的计算和分析工具,对于产出一个可靠的机器学习模型是不充分的。以下是一现有的automl(AutomatedMachine Learning,自动机器学习)系统常见的问题:(1)流程的自动化程度不足。例如只提供了模型训练的自动化环节,但是没有将建模特征筛选环节进行自动化。(2)业务人员不能获得足够的信息,去识别建模数据集是否存在异常或者去判断模型做出预测的依据是否合理,导致产出的模型不可靠。(3)缺少模拟在实际运行环节的模型环节,难以评估在真实上线环境的表现。有时存在模型训练时,训练数据的样本构建方式和模型上线应用时的样本构建方式不一致的情况。这时在模型训练完成后,模拟上线时的使用方式,收集模型表现数据并且评估模型表现非常重要。否则容易出现模型训练完成后表现评估很好,但是上线后大幅下跌的情况。由此可见,基于现有技术中的auto-ml(Automated Machine Learning,自动机器学习)系统不足以支持自动获取可靠的模型。
因此,如何提供一种基于用户数据建模的分析方法、系统、介质及设备,以解决现有技术无法自动化地生成可靠的机器学习模型并向业务人员提供足够的分析信息等缺陷,成为本领域技术人员亟待解决的技术问题。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种基于用户数据建模的分析方法、系统、介质及设备,用于解决现有技术无法自动化地生成可靠的机器学习模型并向业务人员提供足够的分析信息的问题。
为实现上述目的及其他相关目的,本发明一方面提供一种基于用户数据建模的分析方法,所述基于用户数据建模的分析方法包括:对用户数据进行特征分析,生成特征分析结果;对所述特征分析结果进行随时间变化的稳定性检验,以检测异常数据,并根据异常数据检测结果判断所述特征分析结果是否可靠;若是,执行下一步骤,若否,返回上一步骤;将所述特征分析结果进行预处理后,结合预处理数据对所述用户数据建模时所需的特征进行筛选;利用筛选后的特征进行用户数据建模,生成用户数据模型;对所述用户数据模型进行模型分析,以得到所述用户数据模型的可靠性分析结果,所述可靠性分析结果用于至少向业务人员呈现所述用户数据模型的判断依据的合理性和用户数据建模时所用的每个特征对预测结果的影响程度。
于本发明的一实施例中,对用户数据进行特征分析,生成特征分析结果的步骤包括:对所述用户数据进行出现频率指标分析,生成出现频率分析结果;对所述用户数据进行数值型指标分析,生成数值型分析结果;对所述用户数据进行逻辑型指标分析,生成逻辑型分析结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海森亿医疗科技有限公司,未经上海森亿医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011250084.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





