[发明专利]一种网络信息采集方法在审
申请号: | 201711308167.4 | 申请日: | 2017-12-11 |
公开(公告)号: | CN110020160A | 公开(公告)日: | 2019-07-16 |
发明(设计)人: | 王雅文 | 申请(专利权)人: | 镇江共远软件开发有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络信息 判断模块 网络账号 筛选 数据存储模块 网络信息采集 网络信息技术 关联 关键词查找 关注信息 实时性 存储 查找 | ||
1.一种网络信息采集方法,其特征在于,采用一个判断模块对多个网络账号进行筛选,随后采用所述判断模块对被筛选出的所述网络账号所关联的网络信息进行筛选;
采用一个数据存储模块存储被筛选出的所述网络账号以及所关联的所述网络信息;
所述判断模块与所述数据存储模块连接,;
所述网络信息采集方法具体包括:
步骤1,获取多个网络账号,以作为所述关注账号并保存;
步骤2,获取多个所述关注账号所发布的多条所述网络信息,以作为所述关注信息并保存;
步骤3,返回本次信息获取的所述网络信息的发布序号的最大值,并作为最大序号信息,并保存;
步骤4,经过一预设的第一时间间隔后,返回所述步骤1。
2.如权利要求1所述的网络信息采集方法,其特征在于,在所述数据存储模块内设置多个第一存储空间;采用所述判断模块对多个所述网络账号进行筛选,并以被筛选出的所述网络账号作为关注账号;
每个所述第一存储空间用于保存一个所述关注账号。
3.如权利要求2所述的网络信息采集方法,其特征在于,所述步骤1中,将多个所述关注账号所关联的所述网络账号作为所述关注账号,并保存入所述第一存储空间内。
4.如权利要求3所述的网络信息采集方法,其特征在于,在所述数据存储模块内设置多个第二存储空间,采用所述判断模块对多个所述关注账号所关联的多条所述网络信息进行筛选,并以被筛选出的所述网络信息作为关注信息;
每个所述第二存储空间包括多个独立的存储块,每个所述存储块用于保存一个所述关注信息;每个所述第二存储空间对应一个所述第一存储空间。
5.如权利要求4所述的网络信息采集方法,其特征在于,采用一个删除模块去除保存于多个所述第一存储空间中的所述关注账号;
所述删除模块连接所述数据存储模块;
若所述关注账号超过一预设的第二时间间隔未发布所述网络信息,则将所述关注账号从所述第一存储空间中去除。
6.如权利要求3所述的网络信息采集方法,其特征在于,所述步骤1中,获取多个网络账号,以作为所述关注账号并保存的具体步骤包括:
步骤11,获取每个所述网络账号已经发布的所述网络信息;
步骤12,将每条所述网络信息与多个预设的关键词信息进行匹配;
若匹配成功,则转至步骤13;
若匹配失败,则退出;
步骤13,判断匹配成功的所述网络信息的出现频率;
若一个所述网络账号中,匹配成功的所述网络信息出现的频率大于一预设的频率时,则将所述网络账号作为所述关注账号并保存入所述第一存储空间中;随后转至步骤14;
若一个所述网络账号中,匹配成功的所述网络信息出现的频率小于一预设的频率时,则退出;
步骤14,将多个所述关注账号所关联的所述网络账号作为所述关注账号,并保存入所述第一存储空间中。
7.如权利要求6所述的网络信息采集方法,其特征在于,在所述数据存储模块中设置多个第三存储空间,每个所述第三存储空间中保存有一个所述预设的关键词信息。
8.如权利要求7所述的网络信息采集方法,其特征在于,所述步骤2中,获取多个所述关注账号所发布的多条所述网络信息,以作为所述关注信息并保存的具体步骤包括:
步骤21,获取每个所述关注账号发布的所述网络信息;
步骤22,获取每条所述网络信息的发布序号,并根据所述发布序号判断所述网络信息是否已经被获取;
若所述网络信息已经被获取,则退出;
若所述网络信息未被获取,则转至步骤b3;
步骤23,以多个所述预设的关键词信息对所述网络信息进行匹配;
若匹配成功,则转至步骤24;
若匹配不成功,则退出;
步骤24,将所述网络信息作为所述关注信息并保存入所述第二存储空间内。
9.如权利要求8所述的网络信息采集方法,其特征在于,所述步骤22中,根据所述发布序号判断所述网络信息是否曾经被获取的过程具体包括:
将每个所述发布序号与上一次信息获取的所述最大序号信息进行匹配;
若所述发布序号大于所述最大序号信息,则判断所述网络信息未被获取;
若所述发布序号小于所述最大序号信息,则判断所述网络信息已经被获取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于镇江共远软件开发有限公司,未经镇江共远软件开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711308167.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于数据特征的舆情分析方法和系统
- 下一篇:数据处理方法、日志处理方法和终端