[发明专利]论坛热帖归档管理方法、装置、计算机设备和存储介质在审
| 申请号: | 201811637227.1 | 申请日: | 2018-12-29 |
| 公开(公告)号: | CN109741200A | 公开(公告)日: | 2019-05-10 |
| 发明(设计)人: | 郑巨双 | 申请(专利权)人: | 深圳英飞拓智能技术有限公司 |
| 主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F16/951;G06F16/9535;G06F16/335 |
| 代理公司: | 深圳市精英专利事务所 44242 | 代理人: | 冯筠 |
| 地址: | 518000 广东省深圳市龙华区观湖街道*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 帖子 归档管理 论坛热帖 归档 计算机设备 存储介质 归档信息 获取内容 论坛帖子 数据分析 信息统计 热贴 论坛 申请 管理 | ||
1.一种论坛热帖归档管理方法,所述方法包括:
获取论坛热帖归档管理请求;
根据所述论坛热帖归档管理请求,获取对应的论坛列表;
根据所述论坛列表,获取内容有变化的帖子列表;
判断所述帖子列表中的帖子是否符合热帖条件;
若所述帖子符合热帖条件则判断所述帖子是否存在于归档的热帖中;
若所述帖子已经归档,则按照所述帖子的归档信息获取上次爬取的位置并对所述帖子进行信息统计以及管理。
2.根据权利要求1所述的论坛热帖归档管理方法,其特征在于,所述判断所述帖子列表中的帖子是否符合热帖条件的步骤还包括:
判断所述帖子是否存在于归档的热帖中;
若存在于归档的热帖中,则根据上次爬取的位置继续爬取所述帖子的内容;
若不存在于归档的热帖中,则从头开始爬取所述帖子的内容;
爬取所述帖子的内容包含:帖子信息和统计信息;
其中,所述帖子信息包括:访问量、标题、作者、发表时间、最近更新时间、来源网站以及每个楼层的信息;
所述统计信息包括:回复数量、评价数量、参与回复的人员、人员回复的次数、点赞最多的楼层、评论最多楼层以及最后楼层的信息。
3.根据权利要求2所述的论坛热帖归档管理方法,其特征在于,所述判断所述帖子是否存在于归档的热帖中的步骤还包括:
获取所述帖子的作者、发表时间、标题信息、访问量、来源网站以及回帖数,将所述帖子的信息与归档热帖的信息进行比对;
若帖子的作者、发表时间、标题信息以及来源网站完全相同,且访问量和评价数大于等于所述归档热帖,则认定为同一帖;
获取所述归档热帖的信息,根据上次归档的最后位置,查找到对应的楼层,继续获取后面的楼层信息,更新所述归档热帖的相关信息。
4.根据权利要求3所述的论坛热帖归档管理方法,其特征在于,在所述获取所述帖子的作者、发表时间、标题信息、访问量、来源网站以及回帖数,将所述帖子的信息与归档热帖的信息进行比对的步骤之后还包括:
若帖子的作者、标题信息以及来源网站相同,而发表时间不同,则认为为重复帖;
判断所述归档热帖最后楼层的时间是否在当前帖子最近更新的时间之前;
如是则更新所述归档热帖的相关信息,否则不进行处理。
5.根据权利要求3所述的论坛热帖归档管理方法,其特征在于,在所述获取所述帖子的作者、发表时间、标题信息、访问量、来源网站以及回帖数,将所述帖子的信息与归档热帖的信息进行比对的步骤之后还包括:
若帖子的作者或者标题信息不同则对所述帖子进行重新归档。
6.根据权利要求1-5任一项所述的论坛热帖归档管理方法,其特征在于,所述方法还包括:
对所述帖子的热度进行评分;
定期整理已归档的热帖,根据所述帖子热度的评分将热度降低的热帖从归档的热帖列表中删除。
7.根据权利要求6所述的论坛热帖归档管理方法,其特征在于,所述对所述帖子的热度进行评分的步骤包括:
对于没有归档的帖子,获取所述帖子的访问量、发帖时间和回帖数,并计算所述帖子的初始热度;顺序获取所述帖子中所有楼层信息,根据楼层的评价数和点赞数对热度进行修正;判断当前楼层和上一个楼层是否隔天,若有则按照天数对热度进行修正;
对于已经归档的热帖,获取所述热帖的新的访问量以及回复量,根据所述新的访问量以及回复量对所述已经归档的热帖的热度进行修正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳英飞拓智能技术有限公司,未经深圳英飞拓智能技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811637227.1/1.html,转载请声明来源钻瓜专利网。





