[发明专利]基于机器学习和抽样算法的微博粉丝数获取方法及装置在审
申请号: | 201810967355.6 | 申请日: | 2018-08-23 |
公开(公告)号: | CN109255101A | 公开(公告)日: | 2019-01-22 |
发明(设计)人: | 黄楷;梁新敏;陈羲;吴明辉 | 申请(专利权)人: | 北京学之途网络科技有限公司 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06Q50/00 |
代理公司: | 北京天方智力知识产权代理事务所(普通合伙) 11719 | 代理人: | 谷成 |
地址: | 100102 北京市朝阳*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种基于机器学习和抽样算法的微博粉丝数获取方法及装置,其中方法包括:获取待判别用户社交信息,提取待判别用户社交信息中的特征数据,将待判别用户社交信息中的特征数据代入GBDT判别模型进行判别,至少得到待判别用户社交信息中的有效用户;根据微博总体用户数、一个KOL的粉丝数、待判别用户社交信息中的有效用户数以及有效用户中关注KOL的粉丝数计算KOL的真实粉丝数。通过本发明提供的基于机器学习和抽样算法的微博粉丝数获取方法及装置,可以分析微博中真实用户的用户社交信息,并通过抽样算法进行某个KOL真实粉丝数的计算。无需使用微博全量数据,也无需对微博的文本进行复杂的模型构建,技术简单易试试。 | ||
搜索关键词: | 用户社交信息 粉丝 微博 抽样算法 基于机器 特征数据 有效用户 有效用户数 模型构建 判别模型 全量数据 真实用户 学习 文本 分析 | ||
【主权项】:
1.一种基于机器学习和抽样算法的微博粉丝数获取方法,其特征在于,包括:获取待判别用户社交信息,提取所述待判别用户社交信息中的特征数据,将所述待判别用户社交信息中的特征数据代入GBDT判别模型进行判别,至少得到所述待判别用户社交信息中的有效用户;根据微博总体用户数、一个KOL的粉丝数、所述待判别用户社交信息中的有效用户数以及所述待判别用户社交信息中的有效用户中关注所述KOL的粉丝数计算所述KOL的真实粉丝数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京学之途网络科技有限公司,未经北京学之途网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810967355.6/,转载请声明来源钻瓜专利网。