[发明专利]一种数据模型处理方法及其装置有效
申请号: | 201710154285.8 | 申请日: | 2017-03-15 |
公开(公告)号: | CN108629351B | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 刘克俊 | 申请(专利权)人: | 腾讯科技(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 蒋雅洁;李梅香 |
地址: | 100080 北京市海淀区海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据模型 处理 方法 及其 装置 | ||
本发明实施例公开了一种数据模型处理方法,所述方法包括:确定待处理数据,从所述待处理数据中提取出至少一个第一特征信息;基于所述至少一个第一特征信息,选取出具有至少两个第二特征信息的第一模型,其中,所述至少两个第二特征信息与所述至少一个第一特征信息至少部分相同;对所述第一模型中至少两个第二特征信息进行组合处理,得到至少一个目标特征信息,基于所述待处理数据确定出所述至少一个目标特征信息的权重,根据确定出的权重以及所述至少一个目标特征信息得到第二模型。本发明实施例还公开了一种数据模型处理装置。
技术领域
本发明涉及数据处理技术,尤其涉及一种数据模型处理方法及其装置。
背景技术
在逻辑回归模型训练场景中,经常会面临新的应用场景所能提供的训练数据较少的情况,比如,在展示广告场景下,新广告位展示数据非常少时,无法直接进行模型训练,但其它广告位展示数据相对充分且已训练得到数据模型,此时,若直接利用其他应用场景的训练数据得到的数据模型对新应用场景中的训练数据进行训练,会出现数据训练不充分,训练结果误差较大的问题。
发明内容
为解决现有存在的技术问题,本发明实施例提供了一种数据模型处理方法及其装置,能至少解决现有技术中存在的上述问题。
本发明实施例的技术方案是这样实现的:
本发明实施例第一方面提供了一种数据模型处理方法,所述方法包括:
确定待处理数据,从所述待处理数据中提取出至少一个第一特征信息;
基于所述至少一个第一特征信息,选取出具有至少两个第二特征信息的第一模型,其中,所述至少两个第二特征信息与所述至少一个第一特征信息至少部分相同;
对所述第一模型中至少两个第二特征信息进行组合处理,得到至少一个目标特征信息;
基于所述待处理数据确定出所述至少一个目标特征信息的权重,根据确定出的权重以及所述至少一个目标特征信息得到第二模型。
上述方案中,所述对所述第一模型中至少两个第二特征信息进行组合处理,得到至少一个目标特征信息,包括:
获取所述至少两个第二特征信息在所述第一模型中对应的权重;
对所述第一模型中至少两个第二特征信息进行组合处理,得到至少一个目标特征信息,以使根据所述至少一个目标特征信息得到的第二模型中目标特征信息的个数少于所述第一模型中第二特征信息的个数;
其中,所述第二模型中每一所述目标特征信息均能表征自身所包含的第二特征信息,以及所包含的第二特征信息在所述第一模型中的权重。
上述方案中,所述对所述第一模型中至少两个第二特征信息进行组合处理,得到至少一个目标特征信息,包括:
从所述至少两个第二特征信息中选取出具有关联关系的第二特征信息,将具有关联关系的第二特征信息进行组合,得到至少一个目标特征信息;和/或,
从所述至少两个第二特征信息中选取出与每一所述第一特征信息具有关联的第二特征信息,将与每一所述第一特征信息具有关联关系的所有第二特征信息进行组合,得到至少一个目标特征信息。
上述方案中,所述基于所述至少一个第一特征信息,选取出具有至少两个第二特征信息的第一模型,包括:
确定所述待处理数据的目标应用场景;
根据所述待处理数据的目标应用场景以及所述至少一个第一特征信息,选取出具有至少两个第二特征信息的第一模型,以使选取出的第一模型所对应的应用场景与所述目标应用场景相关联,使所述至少两个第二特征信息与所述至少一个第一特征信息至少部分相同;对应地,
所述第二模型能够用于对所述目标应用场景的其他待处理数据进行数据分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(北京)有限公司,未经腾讯科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710154285.8/2.html,转载请声明来源钻瓜专利网。