[发明专利]一种数据模型处理方法及其装置有效

申请号：	201710154285.8	申请日：	2017-03-15
公开（公告）号：	CN108629351B	公开（公告）日：	2022-05-13
发明（设计）人：	刘克俊	申请（专利权）人：	腾讯科技（北京）有限公司
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京派特恩知识产权代理有限公司 11270	代理人：	蒋雅洁;李梅香
地址：	100080 北京市海淀区海淀***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种数据模型处理方法及其装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种数据模型处理方法，所述方法包括：确定待处理数据，从所述待处理数据中提取出至少一个第一特征信息；基于所述至少一个第一特征信息，选取出具有至少两个第二特征信息的第一模型，其中，所述至少两个第二特征信息与所述至少一个第一特征信息至少部分相同；对所述第一模型中至少两个第二特征信息进行组合处理，得到至少一个目标特征信息，基于所述待处理数据确定出所述至少一个目标特征信息的权重，根据确定出的权重以及所述至少一个目标特征信息得到第二模型。本发明实施例还公开了一种数据模型处理装置。

技术领域

本发明涉及数据处理技术，尤其涉及一种数据模型处理方法及其装置。

背景技术

在逻辑回归模型训练场景中，经常会面临新的应用场景所能提供的训练数据较少的情况，比如，在展示广告场景下，新广告位展示数据非常少时，无法直接进行模型训练，但其它广告位展示数据相对充分且已训练得到数据模型，此时，若直接利用其他应用场景的训练数据得到的数据模型对新应用场景中的训练数据进行训练，会出现数据训练不充分，训练结果误差较大的问题。

发明内容

为解决现有存在的技术问题，本发明实施例提供了一种数据模型处理方法及其装置，能至少解决现有技术中存在的上述问题。

本发明实施例的技术方案是这样实现的：

本发明实施例第一方面提供了一种数据模型处理方法，所述方法包括：

确定待处理数据，从所述待处理数据中提取出至少一个第一特征信息；

基于所述至少一个第一特征信息，选取出具有至少两个第二特征信息的第一模型，其中，所述至少两个第二特征信息与所述至少一个第一特征信息至少部分相同；

对所述第一模型中至少两个第二特征信息进行组合处理，得到至少一个目标特征信息；

基于所述待处理数据确定出所述至少一个目标特征信息的权重，根据确定出的权重以及所述至少一个目标特征信息得到第二模型。

上述方案中，所述对所述第一模型中至少两个第二特征信息进行组合处理，得到至少一个目标特征信息，包括：

获取所述至少两个第二特征信息在所述第一模型中对应的权重；

对所述第一模型中至少两个第二特征信息进行组合处理，得到至少一个目标特征信息，以使根据所述至少一个目标特征信息得到的第二模型中目标特征信息的个数少于所述第一模型中第二特征信息的个数；

其中，所述第二模型中每一所述目标特征信息均能表征自身所包含的第二特征信息，以及所包含的第二特征信息在所述第一模型中的权重。