[发明专利]一种话题热度的确定方法和装置在审
申请号: | 201911102826.8 | 申请日: | 2019-11-12 |
公开(公告)号: | CN110909232A | 公开(公告)日: | 2020-03-24 |
发明(设计)人: | 左云鹏;沈海涛;苏萌;高体伟;刘钰;黄伟 | 申请(专利权)人: | 北京百分点信息科技有限公司 |
主分类号: | G06F16/9532 | 分类号: | G06F16/9532;G06F16/33 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 许振新 |
地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 话题 热度 确定 方法 装置 | ||
1.一种话题热度的确定方法,其特征在于,包括:
获取目标话题所涉及的多个新闻的特征数据和多个博文的特征数据;
根据所述多个新闻的特征数据,确定所述多个新闻的新闻热度;
根据所述多个博文的特征数据,确定所述多个博文的博文热度;
根据所述新闻热度和所述博文热度,确定所述目标话题的热度。
2.如权利要求1所述的方法,其特征在于,
所述多个新闻的特征数据包括每个新闻的媒体来源、发布时间、评论数、点赞数和转发数;
其中,根据所述多个新闻的特征数据,确定所述多个新闻的新闻热度,包括:
针对每个新闻,将所述新闻的评论数、点赞数以及转发数进行加权求和,得到第一热度;
确定所述新闻的媒体来源的影响力;
将所述第一热度与所述影响力相乘,得到第二热度;
根据所述新闻的发布时间和预设的时间衰减函数,对所述第二热度进行时间衰减,得到所述新闻的热度;
将所述多个新闻各自的热度相加,得到所述多个新闻的新闻热度。
3.如权利要求2所述的方法,其特征在于,确定所述新闻的媒体来源的影响力,包括:
获取所述新闻的媒体来源的媒体权重、网站权重、百度权重和PR值;
对所述媒体权重、所述网站权重、所述百度权重和所述PR值进行归一化;
将归一化后的所述媒体权重、所述网站权重、所述百度权重和所述PR值进行加权求和,得到所述影响力。
4.如权利要求1所述的方法,其特征在于,
所述多个博文的特征数据包括所述多个博文的总评论数、总转发数和总点赞数;
其中,根据所述多个博文的特征数据,确定所述多个博文的博文热度,包括:
对所述多个博文的总评论数、总转发数和总点赞数进行加权求和,得到第三热度;
根据所述多个博文的发布时间和预设的时间衰减函数,对所述第三热度进行时间衰减,得到所述多个博文的博文热度。
5.如权利要求1所述的方法,其特征在于,根据所述新闻热度和所述博文热度,确定所述目标话题的热度,包括:
确定所述多个新闻的第一权重和所述多个博文的第二权重,所述第一权重和所述第二权重的和为1;
根据所述第一权重和所述第二权重,对所述新闻热度和所述博文热度进行加权求和,得到所述目标话题的热度。
6.一种话题热度的确定装置,其特征在于,包括:
获取单元,获取目标话题所涉及的多个新闻的特征数据和多个博文的特征数据;
第一确定单元,根据所述多个新闻的特征数据,确定所述多个新闻的新闻热度;
第二确定单元,根据所述多个博文的特征数据,确定所述多个博文的博文热度;
第三确定单元,根据所述新闻热度和所述博文热度,确定所述目标话题的热度。
7.如权利要求6所述的装置,其特征在于,
所述多个新闻的特征数据包括每个新闻的媒体来源、发布时间、评论数、点赞数和转发数;
其中,所述第一确定单元,根据所述多个新闻的特征数据,确定所述多个新闻的新闻热度,包括:
针对每个新闻,将所述新闻的评论数、点赞数以及转发数进行加权求和,得到第一热度;
确定所述新闻的媒体来源的影响力;
将所述第一热度与所述影响力相乘,得到第二热度;
根据所述新闻的发布时间和预设的时间衰减函数,对所述第二热度进行时间衰减,得到所述新闻的热度;
将所述多个新闻各自的热度相加,得到所述多个新闻的新闻热度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百分点信息科技有限公司,未经北京百分点信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911102826.8/1.html,转载请声明来源钻瓜专利网。