[发明专利]信息补充方法、装置、电子设备及计算机可读存储介质在审

申请号：	202010526769.2	申请日：	2020-06-10
公开（公告）号：	CN111667013A	公开（公告）日：	2020-09-15
发明（设计）人：	王建华;陈斌斌	申请（专利权）人：	创新奇智（广州）科技有限公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	蒋姗
地址：	510700 广东省广州***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	信息补充方法装置电子设备计算机可读存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种信息补充方法、装置、电子设备及计算机可读存储介质，属于数据挖掘领域。该方法先确定出目标降维方式；根据目标降维方式对数据所包括的特征进行筛选，得到选中特征及落选特征；用落选特征训练根据任务场景所确定的基础网络模型，得到第一网络模型，并获取第一网络模型针对落选特征输出的第一预测值；将第一预测值所表征的信息补充到选中特征内，得到融合特征。针对上述融合特征而言，既对原始数据进行降维处理，降低了原始数据的数据量，又将由于降维操作导致的信息缺失的众多特征作为新的一维特征加入到选中特征中，因此，最后得到的融合特征既可以防止数据量太大，又可以减少降维特的信息丢失。

技术领域

本申请属于数据挖掘领域，具体涉及一种信息补充方法、装置、电子设备及计算机可读存储介质。

背景技术

针对不同的任务场景，未被处理的数据往往包含许多冗余的特征。若不对数据进行处理，直接将未被处理的数据用于后续任务场景，庞大的数据量会增加后续任务场景的复杂度，不利用数据的后续应用，因此，一般会根据具体的任务场景对数据进行降维处理后，再基于降维后的数据进行后续任务。

然而，不可避免地，降维操作会导致数据出现信息缺失，又会对后续的任务带来不好的影响。

发明内容

有鉴于此，本申请的目的在于提供一种信息补充方法、装置、电子设备及计算机可读存储介质，在对数据进行降维的同时，尽可能少地减少数据的信息缺失。

本申请的实施例是这样实现的：

第一方面，本申请实施例提供一种信息补充方法，所述方法包括：根据数据所适用的任务场景，确定出对所述数据的特征进行降维的目标降维方式；根据所述目标降维方式对所述数据所包括的特征进行筛选，得到选中特征及落选特征；基于所述落选特征对根据所述任务场景所确定的基础网络模型进行训练，得到第一网络模型，并获取所述第一网络模型针对所述落选特征输出的第一预测值，所述第一预测值用于表征所述落选特征所包含的信息；将所述第一预测值所表征的信息补充到所述选中特征内，得到融合特征。针对上述融合特征而言，既对原始数据进行降维处理，降低了原始数据的数据量，又将由于降维操作导致的信息缺失的众多特征所包括的与任务场景相关的信息作为新的一维特征加入到选中特征中，因此，最后得到的融合特征既可以防止数据量太大导致的复杂度，又可以尽可能地减少由于特征降维所导致的信息丢失，避免对后续任务带来不好的影响。

结合第一方面实施例，在一种可能的实施方式中，所述将所述第一预测值所表征的信息补充到所述选中特征内，得到融合特征，包括：将所述第一预测值转变成与所述选中特征同一数量级的新特征；将所述新特征加入到所述选中特征内，得到所述融合特征。

结合第一方面实施例，在一种可能的实施方式中，所述将所述第一预测值所表征的信息补充到所述选中特征内，得到融合特征，包括：基于所述选中特征对所述基础网络模型进行训练，得到第二网络模型，并获取所述第二网络模型针对所述选中特征输出的第二预测值，所述第二预测值用于表征所述选中特征所包含的信息；获取所述第一网络模型的第一评价指标及所述第二网络模型的第二评价指标；根据所述第一评价指标及所述第二评价指标对所述第一预测值及所述第二预测值进行加权求和，得到所述融合特征。

结合第一方面实施例，在一种可能的实施方式中，所述根据所述第一评价指标及所述第二评价指标对所述第一预测值及所述第二预测值进行加权求和，得到所述融合特征，包括：根据公式M＝H1×Y1/(H1+H2)+H2×Y2/(H1+H2),得到所述融合特征；其中，M为所述融合特征，Y1为所述第一预测值，Y2为所述第二预测值，H1为所述第一评价指标，H2为所述第二评价指标。

结合第一方面实施例，在一种可能的实施方式中，所述基于所述落选特征对根据所述任务场景所确定的基础网络模型进行训练，得到第一网络模型，并获取所述第一网络模型针对所述落选特征输出的第一预测值，包括：基于所述落选特征分别对多个所述基础网络模型进行训练，得到多个预测值；将所述多个预测值进行加权求和，得到所述第一预测值。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于创新奇智（广州）科技有限公司，未经创新奇智（广州）科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010526769.2/2.html，转载请声明来源钻瓜专利网。

上一篇：分类结果修正方法、装置、修正设备及可读存储介质
下一篇：搭建加密数据传输通道的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]信息补充方法、装置、电子设备及计算机可读存储介质在审

专利文献下载