[发明专利]一种移动终端用户性别的预测方法、服务器和系统有效
申请号: | 201611089521.4 | 申请日: | 2016-11-30 |
公开(公告)号: | CN106776925B | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 路瑶;张夏天 | 申请(专利权)人: | 腾云天宇科技(北京)有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/906;G06K9/62 |
代理公司: | 北京思睿峰知识产权代理有限公司 11396 | 代理人: | 谢建云;赵爱军 |
地址: | 100027 北京市东城区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 移动 终端 用户 性别 预测 方法 服务器 系统 | ||
本发明公开了一种预测移动终端用户性别的方法,适于在服务器中执行,该服务器中预先存储有第一模型样本A1和用于性别预测的分类模型,该方法包括:收集多个待测终端的第二设备信息作为整体待测样本B,并从中选出第一待测样本B1;将样本A1和B1进行聚类后选出分布较均匀的类;从该类中取出第一模型子样本A11和第一待测子样本B11,并从前者选取一部分来训练分类模型;对第一待测子样本B11中的用户性别进行预测,并将该样本B11从样本B中剔除后加入到样本A1中,得到第二模型样本A2;从更新后的样本B中选取第二待测样本B2,并预测其中第二待测子样本B22的用户性别;重复上述操作直到处理了样本B中所有移动终端为止。本发明还公开了对应的服务器和系统。
技术领域
本发明涉及移动通信领域,尤其涉及一种移动终端用户性别的预测方法、服务器和系统。
背景技术
随着互联网技术和硬件技术的不断发展,越来越多的人开始使用如智能手机、平板电脑等移动终端设备。同时,移动互联网的广泛普及促使移动应用的发展更加迅猛,用户通过使用移动终端上安装的各类移动应用,进行阅读、聊天、购物等各项活动。用户在移动设备上使用某个应用时,会产生一系列状态数据,例如应用信息、移动设备信息、环境信息、位置信息等。
大量移动设备的使用产生了海量的数据,通过对人群的基本属性、行为习惯、商业价值等多种维度信息数据综合分析即可精准的进行目标受众的画像和定位,并以标签和画像为基础进行精准定向的互联网广告营销。在用户画像的众多维度当中,性别是最重要的维度之一。如果知道了用户的性别,就可以专门向该用户推荐其他同性用户常关注的内容消息,从而提高用户体验和内容点击率或转化率。
因此,需要提供一种能高效准确判断移动终端用户性别的方法。
发明内容
为此,本发明提供一种移动终端用户性别的预测方法、服务器和系统,以力图解决或至少解决上面存在的问题。
根据本发明的一个方面,提供一种移动终端用户性别的预测方法,适于在服务器中执行,该方法包括服务器中预先存储有多个移动终端的第一设备信息作为第一模型样本A1,并根据该第一设备信息创建了用于预测移动终端用户性别的分类模型,该方法包括:步骤1:收集多个待测移动终端的第二设备信息作为整体待测样本B,并从中选取一部分作为第一待测样本B1;步骤2:将第一模型样本A1和第一待测样本B1进行聚类,并从聚类结果中选出第一模型样本A1的移动终端数目占比在一定范围的类;步骤3:从选出的类中取出第一模型子样本A11和第一待测子样本B11,并从第一模型子样本A11中选取一部分样本作为训练样本,对构建好的分类模型进行训练;步骤4:根据第一待测子样本B11的第二设备信息及所述训练好的分类模型,预测得到该样本B11中每个移动终端的用户性别;步骤5:将已经预测过用户性别的第一待测子样本B11从整体待测样本B中剔除,并将其加入到所述第一模型样本A1中,得到第二模型样本A2;步骤6:从剔除了第一待测子样本B11后的整体待测样本B中选取第二待测样本B2;步骤7:在第二模型样本A2和第二待测样本B2的基础上,重复上述步骤2-4,以预测得到第二待测子样本B22中移动终端的用户性别;以及步骤8:重复上述步骤5-7直到处理了整体待测样本B中的所有移动终端为止。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾云天宇科技(北京)有限公司,未经腾云天宇科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611089521.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网页页面预览方法及装置
- 下一篇:改善机器人对话时的应答能力的方法及系统