[发明专利]基于多数据源建模的消息发送方法、装置和电子设备有效
| 申请号: | 202110484137.9 | 申请日: | 2021-04-30 |
| 公开(公告)号: | CN113298121B | 公开(公告)日: | 2023-08-18 |
| 发明(设计)人: | 朱婷;张潮华 | 申请(专利权)人: | 上海淇玥信息技术有限公司 |
| 主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/25;G06F21/62;G06F16/953;G06Q10/0635 |
| 代理公司: | 北京清诚知识产权代理有限公司 11691 | 代理人: | 乔东峰 |
| 地址: | 201500 上海市崇明*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 多数 建模 消息 发送 方法 装置 电子设备 | ||
1.一种基于多数据源建模的消息发送方法,其特征在于,该方法包括如下步骤:
分别获取来自多个不同数据源的设备数据,所述不同数据源的设备数据中特征相互重叠,以联合不同数据源使得样本数据量增多且每个样本数据中特征不会增多;
分别使用来自每一数据源的设备数据生成对应于每一数据源的样本数据集,并将每一样本数据集划分为对应的训练数据集和测试数据集;
针对每一数据源,使用对应于该数据源的训练数据集训练得到对应的子模型,从而得到对应多个不同数据源的多个子模型;
针对每个子模型的初始权重值分别判断各子模型的初始权重值是否收敛,如果不满足该收敛条件则对不满足该收敛条件的初始权重值进行调整;选取接收者操作特征ROC曲线下的面积AUC作为评估函数,分别使用来自每一数据源的测试数据集输入到对应的子模型进行测试,获得每个子模型的AUC值,利用主成分分析法以主成分的方差贡献率为权重对指标在各主成分线性组合中的系数的加权平均的归一化,确定各个子模型的权重;将各子模型的权重值与实时监测的对应的各个数据源的质量关联以调整各子模型的权重;
根据所述多个子模型的权重,将所述多个子模型的输出值进行加权融合,使用融合后的多个子模型的总模型计算新设备的评分;
根据所述评分和预定策略向该新设备发送消息。
2.如权利要求1所述的方法,其特征在于:分别使用来自每一数据源的测试数据集输入到对应的子模型进行测试,获得每个子模型的AUC值,利用主成分分析法以主成分的方差贡献率为权重对指标在各主成分线性组合中的系数的加权平均的归一化,确定各个子模型的权重还包括:
每个子模型的AUC值用作筛选指标,并作为后续子模型加权融合的权重系数。
3.如权利要求1所述的方法,其特征在于:分别使用来自每一数据源的测试数据集输入到对应的子模型进行测试,获得每个子模型的AUC值,利用主成分分析法以主成分的方差贡献率为权重对指标在各主成分线性组合中的系数的加权平均的归一化,确定各个子模型的权重还包括:
根据每个子模型的AUC值以及每个子模型的初始预设权重计算每个子模型的权重。
4.如权利要求1所述的方法,其特征在于:所述针对每一数据源,根据各个子模型自身的贡献,对贡献值做标准化处理,得到各个子模型的权重,具体还包括:
针对每个子模型的初始权重值,分别判断各子模型的初始权重值是否收敛,如果有一个子模型的权重值收敛而其他子模型的权重值不收敛时,继续对各子模型的各权重值进行训练或者仅针对不收敛的子模型的权重值进行训练,直至各权重值均收敛为止。
5.根据权利要求1-4任一项所述的方法,其特征在于,还包括:
分别对来自每一数据源的数据进行预处理的步骤。
6.根据权利要求5所述的方法,其特征在于,所述分别对来自每一数据源的数据进行预处理,具体包括:
对所述数据做缺失值填充,统计完数据的缺率后,舍弃缺失率超过预定阈值的数据,使用相似数据替代缺失的数据进行训练。
7.根据权利要求6所述的方法,其特征在于,还包括:
如果没有相似数据,则后续不使用来自该数据源的数据训练得到对应的子模型,并调整其他子模型的权重以供融合。
8.根据权利要求1-7任一项所述的方法,其特征在于,
所述多个子模型是相同类型的子模型;或,所述多个子模型包括至少两种不同类型的子模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇玥信息技术有限公司,未经上海淇玥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110484137.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可多点接入的激光无线能量传输系统
- 下一篇:可拆式温度可控热压组合模具





