[发明专利]信息补充方法、装置、电子设备及计算机可读存储介质在审
| 申请号: | 202010526769.2 | 申请日: | 2020-06-10 |
| 公开(公告)号: | CN111667013A | 公开(公告)日: | 2020-09-15 |
| 发明(设计)人: | 王建华;陈斌斌 | 申请(专利权)人: | 创新奇智(广州)科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 蒋姗 |
| 地址: | 510700 广东省广州*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 信息 补充 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本发明涉及一种信息补充方法、装置、电子设备及计算机可读存储介质,属于数据挖掘领域。该方法先确定出目标降维方式;根据目标降维方式对数据所包括的特征进行筛选,得到选中特征及落选特征;用落选特征训练根据任务场景所确定的基础网络模型,得到第一网络模型,并获取第一网络模型针对落选特征输出的第一预测值;将第一预测值所表征的信息补充到选中特征内,得到融合特征。针对上述融合特征而言,既对原始数据进行降维处理,降低了原始数据的数据量,又将由于降维操作导致的信息缺失的众多特征作为新的一维特征加入到选中特征中,因此,最后得到的融合特征既可以防止数据量太大,又可以减少降维特的信息丢失。
技术领域
本申请属于数据挖掘领域,具体涉及一种信息补充方法、装置、电子设备及计算机可读存储介质。
背景技术
针对不同的任务场景,未被处理的数据往往包含许多冗余的特征。若不对数据进行处理,直接将未被处理的数据用于后续任务场景,庞大的数据量会增加后续任务场景的复杂度,不利用数据的后续应用,因此,一般会根据具体的任务场景对数据进行降维处理后,再基于降维后的数据进行后续任务。
然而,不可避免地,降维操作会导致数据出现信息缺失,又会对后续的任务带来不好的影响。
发明内容
有鉴于此,本申请的目的在于提供一种信息补充方法、装置、电子设备及计算机可读存储介质,在对数据进行降维的同时,尽可能少地减少数据的信息缺失。
本申请的实施例是这样实现的:
第一方面,本申请实施例提供一种信息补充方法,所述方法包括:根据数据所适用的任务场景,确定出对所述数据的特征进行降维的目标降维方式;根据所述目标降维方式对所述数据所包括的特征进行筛选,得到选中特征及落选特征;基于所述落选特征对根据所述任务场景所确定的基础网络模型进行训练,得到第一网络模型,并获取所述第一网络模型针对所述落选特征输出的第一预测值,所述第一预测值用于表征所述落选特征所包含的信息;将所述第一预测值所表征的信息补充到所述选中特征内,得到融合特征。针对上述融合特征而言,既对原始数据进行降维处理,降低了原始数据的数据量,又将由于降维操作导致的信息缺失的众多特征所包括的与任务场景相关的信息作为新的一维特征加入到选中特征中,因此,最后得到的融合特征既可以防止数据量太大导致的复杂度,又可以尽可能地减少由于特征降维所导致的信息丢失,避免对后续任务带来不好的影响。
结合第一方面实施例,在一种可能的实施方式中,所述将所述第一预测值所表征的信息补充到所述选中特征内,得到融合特征,包括:将所述第一预测值转变成与所述选中特征同一数量级的新特征;将所述新特征加入到所述选中特征内,得到所述融合特征。
结合第一方面实施例,在一种可能的实施方式中,所述将所述第一预测值所表征的信息补充到所述选中特征内,得到融合特征,包括:基于所述选中特征对所述基础网络模型进行训练,得到第二网络模型,并获取所述第二网络模型针对所述选中特征输出的第二预测值,所述第二预测值用于表征所述选中特征所包含的信息;获取所述第一网络模型的第一评价指标及所述第二网络模型的第二评价指标;根据所述第一评价指标及所述第二评价指标对所述第一预测值及所述第二预测值进行加权求和,得到所述融合特征。
结合第一方面实施例,在一种可能的实施方式中,所述根据所述第一评价指标及所述第二评价指标对所述第一预测值及所述第二预测值进行加权求和,得到所述融合特征,包括:根据公式M=H1×Y1/(H1+H2)+H2×Y2/(H1+H2),得到所述融合特征;其中,M为所述融合特征,Y1为所述第一预测值,Y2为所述第二预测值,H1为所述第一评价指标,H2为所述第二评价指标。
结合第一方面实施例,在一种可能的实施方式中,所述基于所述落选特征对根据所述任务场景所确定的基础网络模型进行训练,得到第一网络模型,并获取所述第一网络模型针对所述落选特征输出的第一预测值,包括:基于所述落选特征分别对多个所述基础网络模型进行训练,得到多个预测值;将所述多个预测值进行加权求和,得到所述第一预测值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(广州)科技有限公司,未经创新奇智(广州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010526769.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





