[发明专利]数据模型的训练方法及装置有效
申请号: | 201510608997.3 | 申请日: | 2015-09-22 |
公开(公告)号: | CN105224623B | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 秦铎浩 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据模型 训练 方法 装置 | ||
1.一种数据模型的训练方法,其特征在于,所述方法包括:
从日志服务器中获取原始样本数据,所述原始样本数据中包括用户标识信息;
基于所述用户标识信息,获取个人终端上的用户的网络操作数据,所述个人终端为所述用户标识信息对应的用户登录的所有终端;
根据所述网络操作数据,确定用户的个性化信息;
将所述原始样本数据和所述个性化信息作为样本数据进行训练,得到数据模型。
2.根据权利要求1所述的方法,其特征在于,所述用户标识信息包括:
用户在网络平台上注册的账户信息;和/或
用户访问网络时的网络地址和第一用户标识。
3.根据权利要求2所述的方法,其特征在于,所述第一用户标识包括:
用户访问网络时所使用的移动设备的设备标识;或
用户通过浏览器访问网络时,所述浏览器中保存的身份标识,其中,所述身份标识是基于所述浏览器首次访问预定页面时的网络地址和访问时间确定的。
4.根据权利要求2所述的方法,其特征在于,若所述用户标识信息包括用户在网络平台上注册的账户信息,则所述基于所述用户标识信息,获取个人终端上的用户的网络操作数据包括:
将登陆有与所述账户信息对应的账户的所有终端,均确定为所述用户的个人终端;
获取所述个人终端上的所有网络操作数据,作为所述用户的网络操作数据。
5.根据权利要求2所述的方法,其特征在于,若所述用户标识信息包括用户访问网络时的网络地址和第一用户标识时,则所述基于所述用户标识信息,获取个人终端上的用户的网络操作数据包括:
确定通过所述网络地址访问过网络的至少一个第二用户标识;
将所述第一用户标识对应的网络操作数据与每个所述第二用户标识对应的网络操作数据分别进行匹配;
基于匹配结果,从所述至少一个第二用户标识中确定出与所述第一用户标识属于同一用户的第二用户标识;
将所述第一用户标识对应的网络操作数据,以及与所述第一用户标识属于同一用户的第二用户标识对应的网络操作数据,共同作为所述用户的网络操作数据。
6.根据权利要求1所述的方法,其特征在于,所述将所述原始样本数据和所述个性化信息作为样本数据进行训练,得到数据模型包括:
基于所述个性化信息,对已有数据模型的特征数量和权重系数进行修正;
将所述原始样本数据和所述个性化信息作为样本数据,对修正后的模型进行训练,得到数据模型。
7.根据权利要求1至6任一项所述的方法,其特征在于,所述网络操作数据包括以下至少一项:
网页浏览的历史记录;
应用的操作记录;以及
网络搜索记录。
8.根据权利要求1至6任一项所述的方法,其特征在于,所述数据模型包括点击率预估模型或信息推荐模型。
9.根据权利要求8所述的方法,其特征在于,所述方法还包括:
基于所述数据模型的输出结果,向用户推送信息。
10.一种数据模型的训练装置,其特征在于,所述装置包括:
第一获取模块,用于从日志服务器中获取原始样本数据,所述原始样本数据中包括用户标识信息;
第二获取模块,用于基于所述用户标识信息,获取个人终端上的用户的网络操作数据,所述个人终端为所述用户标识信息对应的用户登录的所有终端;
确定模块,用于根据所述网络操作数据,确定用户的个性化信息;
训练模块,将所述原始样本数据和所述个性化信息作为样本数据进行训练,得到数据模型。
11.根据权利要求10所述的装置,其特征在于,所述用户标识信息包括:
用户在网络平台上注册的账户信息;和/或
用户访问网络时的网络地址和第一用户标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510608997.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:油井井口抽油杆扶正器
- 下一篇:卡爪式丢手接头