[发明专利]一种基于Elasticsearch的政府信息资源分类与智能化搜索方法和系统在审
申请号: | 202210424428.3 | 申请日: | 2022-04-21 |
公开(公告)号: | CN114817644A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 周鸣乐;王然;李敏;李刚;韩德隆;刘一鸣;李旺 | 申请(专利权)人: | 山东省计算中心(国家超级计算济南中心);齐鲁工业大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/903;G06F16/9032;G06F16/906;G06F16/951 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 elasticsearch 政府 信息资源 分类 智能化 搜索 方法 系统 | ||
本发明公开了一种基于Elasticsearch的政府信息资源分类与智能化搜索方法和系统,其特征在于,主要功能包括:实现政务信息资源按主题分类和智能化搜索,方法流程包括收集政府数据,对政府信息资源按照政府信息内在相关性和与公众密切相关的主题进行划分,形成多级分类树。搭建Elasticsearch集群,基于Elasticsearch对S1底层数据进行优化,通过RabbitMQ消息中间件异步接入政府信息资源数据。接受用户查询请求并对该请求进行应答。获取用户反馈存入评价列表,并根据评价列表更新多级分类树。根据上述方法构建系统,系统分为数据收集清洗单元、存储单元、服务单元、交互单元以及展示单元。
技术领域
本发明涉及政府数据采集分类以及查询性能优化领域,具体涉及一种基于Elasticsearch的政府信息资源分类与智能化搜索方法和系统。
背景技术
随着电子政务的发展,政府提供的信息服务对公众有着非凡的意义,个性化的、结构化的信息服务模式要求电子政务能够具备应对动态信息需求的能力、解决电子政务信息发布零散的问题。另外政府信息资源的分类是开展信息交流和信息资源共享的重要前提。
在传统的数据库中,数据的组织形式是基于事务处理的,这很难考虑到在与信息服务需求密切相关的主题下组织信息,同时这些数据分散存储在各个政府部门异构的数据库中,不能有效地集成数据。此外,大量的历史数据离线存储,难以在线查询。最后现有的分类系统大多没有统一的规范和全面的分类方案,而且分类方法简单,不能满足整体管理的需要。ElasticSearch是一个开源的分布式搜索引擎,它既能存储和管理大规模的非结构化数据,也能实现对其存储数据的近实时全文检索。在电子政务中引入Elasticsearch技术,更合理地组织数据存储结构和数据资源挖掘,帮助电子政务提供越来越全方位、多功能的信息服务,更好地满足个性化信息服务的要求。对提高公众满意度和建立服务型政府具有积极意义。
发明内容
本发明实例提供一种基于Elasticsearch的政府信息资源分类与智能化搜索方法和系统,提高了政府信息资源的存储效率和用户在搜索和查询政府数据时的效率。
为满足上述需求,本专利提供了一种基于Elasticsearch的政府信息资源分类与智能化搜索方法和系统,其特征在于,包括以下过程:
S1:收集政府数据,对政府信息资源按照政府信息内在相关性和与公众密切相关的主题进行划分,形成多级分类树。
S2:搭建Elasticsearch集群,基于Elasticsearch对S1底层数据进行优化,通过RabbitMQ消息中间件异步接入政府信息资源数据。
S3:接受用户查询请求并对该请求进行应答。
S4:获取用户反馈存入评价列表,并根据评价列表更新多级分类树。
S5:根据上述方法构建系统,系统分为数据收集清洗单元、存储单元、服务单元、交互单元以及展示单元。
1、据权力要求1所述的一种基于Elasticsearch的政府信息资源分类与智能化搜索方法和系统,其特征在于,所述步骤S1包括:
S11:收集政府信息资源,所收集的数据包括内部数据和外部数据。内部数据是政府组织内部产生的当前和历史数据;外部数据是通过网虫爬网web所获得的政府主题相关数据,包括非官方政策解读、商业报告、评估报告以及其他未经收录的其他信息。
S12:数据清洗,包括消除内部和外部数据的各种语义冲突;分析内部外部的统一数据,包括同名文件、同名字段、同义词、同主题词;消除内部外部数据冗余;统一所有数据的编码规则。
S13:计算文档之间的关联度,按照政府数据的内在联系、文档之间的关联度以及主题进行分类构建多级分类树。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东省计算中心(国家超级计算济南中心);齐鲁工业大学,未经山东省计算中心(国家超级计算济南中心);齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210424428.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电动牙刷充电杯及刷牙器具
- 下一篇:一种面向真实世界数据的机器学习系统与方法