[发明专利]一种互联网信息采集系统在审

专利信息
申请号: 201511032832.2 申请日: 2015-12-31
公开(公告)号: CN105447202A 公开(公告)日: 2016-03-30
发明(设计)人: 方净 申请(专利权)人: 宁波公众信息产业有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海申新律师事务所 31272 代理人: 党蕾
地址: 315000 浙江省*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 互联网 信息 采集 系统
【说明书】:

技术领域

发明涉及互联网领域,尤其涉及一种互联网信息采集系统。

背景技术

互联网的普及给各行各业带来了巨大的信息量,大数据也随之应用而生,大数据(bigdata,megadata),或称巨量资料,是指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。

互联网中的大小站点数以千万计,积淀下的信息量更是庞大,在这些信息中存在着相当巨大的关于商机,待遇等方面的数据,绝大部分分布在各大论坛中,各个空间中,BLOG等互动讨论空间中,这些互动空间中的数据具备相当的价值,在一定程度上具备相当大的参考价值,各企事业单位、政府机构等也需要关注这些空间中的互联网舆论,为客户提供及时的互联网舆论方向分析,为公共危机公关,舆论导向等提供数据支持。但目前还没有能够获取为职业认识提供数据参考以及决策支持的较系统和全面的信息系统。

发明内容

针对上述问题现提供能够较系统和全面的获取互联网信息的一种互联网信息采集系统。

具体的技术方案是:

一种互联网信息采集系统,其中,包括:

信息源识别单元,用于根据用户输入的关键字,识别关联于所述关键字的信息源,获取所述信息源的路径;

信息采集单元,连接所述信息源识别单元,用于根据所述路径获取关联于所述信息源的信息;

过滤分析单元,连接所述信息采集单元,用于对采集的所述信息进行识别分析,过滤与所述关键字无关联关系的所述信息;

语义分析单元,连接所述过滤分析单元,用于对存储的所述信息进行语义解析;

数据分析单元,连接所述语义分析单元,用于获取经过所述语义解析的所述信息,并对所述信息进行分析,获得分析结果。

优选的,上述的互联网信息采集系统,其中,所述过滤分析单元包括:

第一识别模块,用于对采集的所述信息进行识别,并根据识别的结果按预置分类进行分类;

过滤模块,连接所述识别模块,用过滤与所述关键字无关联关系的所述信息。

优选的,上述的互联网信息采集系统,其中,包括:

存储管理单元,连接所述过滤分析单元,用于分类存储过滤后的所述信息,并对所述信息进行管理。

优选的,上述的互联网信息采集系统,其中,所述存储管理单元包括:

复数个存储模块,每个所述存储模块用于存储一个类型的所述信息;

信息分类模块,连接所述存储模块,用于根据预设条件对所述信息进行分类,并将识别的所述信息存储在对应的所述存储模块。

优选的,上述的互联网信息采集系统,其中,所述存储管理单元包括:

信息整合模块,用于将采集的所述信息中重复的所述信息进行筛除;

信息检索模块,连接所述信息整合模块用于对筛除后的所述信息根据用户输入信息进行检索。

优选的,上述的互联网信息采集系统,其中,所述语义分析单元包括:

第二识别模块,用于对存储所述信息的内容进行识别,将识别的所述信息分为语言信息和感情信息;

语言语义分析,连接所述第二识别模块,用于对筛选后的所述语言信息进行语义解析,获得第一解析语义;

感情语义分析,连接所述第二识别模块,用于对筛选后的所述感情信息进行语义解析,获得第二解析语义;

优选的,上述的互联网信息采集系统,其中,包括:

监管服务单元,连接所述数据分析单元,用于对获得的所述分析结果进行监管;

优选的,上述的互联网信息采集系统,其中,包括:

报告生成单元,连接所述数据分析单元,用于根据所述分析结果,按预置格式形成一分析报告。

本发明的有益效果是,能够通过对信息源的识别,在获取信息前首先通过筛选到符合用户要求的信息源,通过信息源能够较系统和全面的获取需要的信息,进而为需要的用户提供数据参考以及决策支持。

附图说明

图1为本发明一种互联网信息采集系统较佳实施例中总结构示意图;

图2-5为本发明一种互联网信息采集系统较佳实施例中部分结构示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波公众信息产业有限公司,未经宁波公众信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201511032832.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top