[发明专利]一种专业情报搜集分析应用平台在审
申请号: | 202210024827.0 | 申请日: | 2022-01-11 |
公开(公告)号: | CN114356967A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 雷关勇 | 申请(专利权)人: | 深圳市易海聚信息技术有限公司 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;G06F16/248;G06F16/22;G06F16/215;G06F16/25;G06F16/951;G06F16/31;G06F16/35;G06F16/34;G06F40/289;G06F40/242;G06F40/40 |
代理公司: | 深圳市辉泓专利代理有限公司 44510 | 代理人: | 刘海军;孟强 |
地址: | 518000 广东省深圳市宝安区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 专业 情报 搜集 分析 应用 平台 | ||
本发明提供了一种专业情报搜集分析应用平台,包括:情报信息采集系统,其包括用于采集目标网站数据的采集子系统和用于存储目标网站数据的存储子系统;情报信息服务系统,其包括用于分析存储子系统中数据的分析子系统和用于展示所述分析子系统分析结果的浏览子系统。本申请通过采集子系统自动化收集相关专业情报资料,将情报资料按照标准格式化,经过去重处理后存入存储子系统中,既全面的收集了相关专业情报资料,又减少了数据的冗余,使得数据具有较高的分析价值;再经过分析子系统进行全面的分析,如分类、聚类、热点跟踪、自然语言分析等,最后将结果通过浏览子系统展示;大大提高专业情报搜集的效率及准确性,提高专业情报的利用价值。
【技术领域】
本申请涉及专业情报技术领域,尤其涉及一种专业情报搜集分析应用平台。
【背景技术】
随着时代与技术的发展,在报刊、图书、地图、声像资料等众多公开情报来源当中,互联网已经成了进行公开情报收集的一个重要渠道。计算机互联网络已经遍布全球,因特网已经广泛应用于政治、经济、军事等各个领域,已经形成超越传统地理空间的“计算机网络空间”,其时效性、方便性及内容的丰富性都十分突出。
但是随着互联网,信息越来越庞杂,同时各种资料的获取难度也越来越高。信息的冗余越来越高,依靠人工来进行专业情报收集和分析已不能满足需要。
【发明内容】
本发明的目的在于提供一种专业情报搜集分析应用平台,自动收集专业情报信息,并整理分析形成知识库和分析结果,便于使用。
本发明提供了一种专业情报搜集分析应用平台,包括:
情报信息采集系统,其包括用于采集目标网站数据的采集子系统和用于存储目标网站数据的存储子系统;
情报信息服务系统,其包括用于分析存储子系统中数据的分析子系统和用于展示所述分析子系统分析结果的浏览子系统。
进一步地,所述采集子系统包括:
任务计划编辑模块,用于形成任务计划;
任务计划调度模块,用于调度和执行任务计划;
采集配置模块,用于配置各网站的采集配置;
采集模块,用于按照采集配置进行数据采集;
情报标准化模块,用于将采集到的数据进行标准格式化,形成待入库数据;
存储模块,用于存储待入库数据。
进一步地,所述存储子系统包括:
数据库模块,用于存储二维表结构数据;
索引引擎模块,用于索引数据,便于查询;
查询引擎模块,用于提供查询结构;
文本分析引擎,用于实现自然语言分析;
磁盘索引文件模块,用于索引文件,方便查看及下载、更新及版本控制。
进一步地,所述分析子系统包括:
自动翻译模块,用于调用翻译工具,实现不同语言之间的字词、句子和网页翻译;
自动过滤模块,用于多次采集时进行URL自动排重;
自动去重模块,用于对设定时间内标题相似或者内容相似的专业情报信息进行去重,仅显示最先发布的内容;
关键词识别模块,用于自动识别出专业情报信息中包含用户自定义的关键词与标签词,可在前台表现为标签词和自动分类;
自动分类模块,用于依据用户给每个类别设定的关键词进行自动分类;
自动聚类模块,用于对专业情报信息进行自动聚类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市易海聚信息技术有限公司,未经深圳市易海聚信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210024827.0/2.html,转载请声明来源钻瓜专利网。