[发明专利]文章热度的预测方法和装置在审
申请号: | 202010661581.9 | 申请日: | 2015-12-04 |
公开(公告)号: | CN111858934A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 许祥 | 申请(专利权)人: | 杭州数梦工场科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q10/04 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 王萌 |
地址: | 310024 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文章 热度 预测 方法 装置 | ||
1.一种文章分类方法,其特征在于,包括:
根据用户在当前时刻之前的预定时间长度内发表的历史文章的关键词,为所述用户最新发表的文章生成第一矢量,所述第一矢量的维度等于所述关键词的个数,所述第一矢量中各维度的值分别对应每个关键词在所述用户最新发表的文章中是否出现;
通过聚类模型对所述第一矢量进行聚类判断,获得所述用户最新发表的文章所属的类别。
2.根据权利要求1所述的方法,其特征在于,所述根据用户在当前时刻之前的预定时间长度内发表的历史文章的关键词,为所述用户最新发表的文章生成第一矢量之前,还包括:
获取所述用户在当前时刻之前的预定时间长度内发表的历史文章的关键词;
其中,所述获取所述用户在当前时刻之前的预定时间长度内发表的历史文章的关键词包括:
获得所述用户在当前时刻之前的预定时间长度内发表的历史文章;
使用分词工具从所述历史文章中获取热度排名在预定名次之前的关键词。
3.根据权利要求1所述的方法,其特征在于,所述根据用户在当前时刻之前的预定时间长度内发表的历史文章的关键词,为所述用户最新发表的文章生成第一矢量之后,还包括:
对所述第一矢量进行降维处理。
4.根据权利要求3所述的方法,其特征在于,所述对所述第一矢量进行降维处理,包括:
采用主成分分析方法对所述第一矢量进行降维处理。
5.根据权利要求3所述的方法,其特征在于,所述通过聚类模型对所述第一矢量进行聚类判断,获得所述用户最新发表的文章所属的类别之后,还包括:
通过所述用户最新发表的文章所属类别的回归模型对所述用户最新发表的文章的热度值进行预测。
6.根据权利要求5所述的方法,其特征在于,所述通过聚类模型对所述第一矢量进行聚类判断之前,还包括:
生成所述聚类模型。
7.根据权利要求6所述的方法,其特征在于,所述生成所述聚类模型包括:
根据所述关键词,为所述用户在当前时刻之前的预定时间长度内发表的每篇历史文章生成对应的第二矢量,所述每篇历史文章对应的第二矢量的维度等于所述关键词的个数,所述每篇历史文章对应的第二矢量中各维度的值分别对应每个关键词在每篇历史文章中是否出现;
对所述每篇历史文章对应的第二矢量进行聚类,生成所述聚类模型,以将所述用户在当前时刻之前的预定时间长度内发表的历史文章聚为预定个数的类别。
8.根据权利要求7所述的方法,其特征在于,所述通过所述用户最新发表的文章所属类别的回归模型对所述用户最新发表的文章的热度值进行预测之前,还包括:
针对所述用户在当前时刻之前的预定时间长度内发表的历史文章所属的类别,分别根据每个类别中的历史文章的热度值建立每个类别的回归模型。
9.一种文章分类装置,其特征在于,包括:
生成模块,用于根据用户在当前时刻之前的预定时间长度内发表的历史文章的关键词,为所述用户最新发表的文章生成第一矢量,所述第一矢量的维度等于所述关键词的个数,所述第一矢量中各维度的值分别对应每个关键词在所述用户最新发表的文章中是否出现;
聚类模块,用于通过聚类模型对所述生成模块生成的第一矢量进行聚类判断,获得所述用户最新发表的文章所属的类别。
10.根据权利要求9所述的装置,其特征在于,还包括:
获取模块,用于在所述生成模块为所述用户最新发表的文章生成第一矢量之前,获取所述用户在当前时刻之前的预定时间长度内发表的历史文章的关键词;
其中,所述获取模块,具体用于获得所述用户在当前时刻之前的预定时间长度内发表的历史文章,使用分词工具从所述历史文章中获取热度排名在预定名次之前的关键词。
11.根据权利要求9所述的装置,其特征在于,还包括:降维模块,用于对所述第一矢量进行降维处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州数梦工场科技有限公司,未经杭州数梦工场科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010661581.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种检测快照的方法、装置、设备及存储介质
- 下一篇:一种自动扎带机