[发明专利]基于用户数据建模的分析方法、系统、介质及设备有效
| 申请号: | 202011250084.6 | 申请日: | 2020-11-11 |
| 公开(公告)号: | CN112070239B | 公开(公告)日: | 2021-07-09 |
| 发明(设计)人: | 薛颜波;蔡俊杰 | 申请(专利权)人: | 上海森亿医疗科技有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 徐秋平 |
| 地址: | 201213 上海市浦*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 用户 数据 建模 分析 方法 系统 介质 设备 | ||
1.一种基于用户数据建模的分析方法,其特征在于,所述基于用户数据建模的分析方法包括:
对用户数据进行特征分析,生成特征分析结果;
对所述特征分析结果进行随时间变化的稳定性检验,以检测异常数据,并根据异常数据检测结果判断所述特征分析结果是否可靠;若是,执行下一步骤,若否,返回上一步骤;
将所述特征分析结果进行预处理后,结合预处理数据对所述用户数据建模时所需的特征进行筛选;通过缺失率、信息值和证据权重相关性的技术指标对所述用户数据建模时所需的特征进行筛选,以自动选择出对所述用户数据建模帮助最大的特征组集合;将所述缺失率与第一阈值比较,并将所述缺失率小于所述第一阈值的特征作为第一筛选结果,将所述信息值与第二阈值进行比较,并将所述第一筛选结果中信息值大于所述第二阈值的特征作为第二筛选结果,将所述证据权重相关性与第三阈值进行比较,并对所述第二筛选结果中证据权重相关性大于所述第三阈值的两个特征进行取舍,以保留其中所述缺失率最小和/或所述信息值最大的特征;其中,所述第一阈值、第二阈值和第三阈值作为一取值组合,通过穷举方式或模型预测过程的迭代方式确定所述取值组合中所述第一阈值、第二阈值和第三阈值的最佳取值,以使模型预测效果最佳;
利用筛选后的特征进行用户数据建模,生成用户数据模型;
对所述用户数据模型进行模型分析,以得到所述用户数据模型的可靠性分析结果,所述可靠性分析结果用于至少向业务人员呈现所述用户数据模型的判断依据的合理性和用户数据建模时所用的每个特征对预测结果的影响程度;其中,模型分析包括对所述用户数据模型进行入模特征分析,生成所述入模特征分析结果;所述入模特征分析提供进入所述用户数据模型的特征与预测目标之间的关系分析,并且识别这个关系随着时间是否稳定;所述关系分析是指检测入模特征的属性值应用于模型预测过程中的合理性。
2.根据权利要求1所述的基于用户数据建模的分析方法,其特征在于,对用户数据进行特征分析,生成特征分析结果的步骤包括:
对所述用户数据进行出现频率指标分析,生成出现频率分析结果;
对所述用户数据进行数值型指标分析,生成数值型分析结果;
对所述用户数据进行逻辑型指标分析,生成逻辑型分析结果。
3.根据权利要求1所述的基于用户数据建模的分析方法,其特征在于,将所述特征分析结果进行预处理的步骤包括:
对所述特征分析结果中数值特征数据进行缩放映射和主成分分析;
对所述特征分析结果中分类型数据进行独热编码和独立成分分析。
4.根据权利要求1所述的基于用户数据建模的分析方法,其特征在于,所述可靠性分析结果还包括模型效果分析结果和模型可解释性分析结果;
对所述用户数据模型进行模型效果分析,生成所述模型效果分析结果;
所述模型效果分析包括计算所述用户数据模型的准确率、精确率、召回率、精确率与召回率整体分析值和曲线下的面积。
5.根据权利要求1所述的基于用户数据建模的分析方法,其特征在于:
所述入模特征分析中的入模特征是指经过特征筛选后,最终识别出的对所述用户数据模型重要的、并被所述用户数据模型采用的特征。
6.根据权利要求4所述的基于用户数据建模的分析方法,其特征在于:
对所述用户数据模型进行模型可解释性分析,生成所述模型可解释性分析结果;
所述模型可解释性分析包括分析代表性样本在所述用户数据模型中的预测结果和所述用户数据模型的判断依据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海森亿医疗科技有限公司,未经上海森亿医疗科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011250084.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





