[发明专利]一种社区管理服务大数据处理系统及其处理方法有效

专利信息
申请号: 201510070156.1 申请日: 2015-02-10
公开(公告)号: CN104615734B 公开(公告)日: 2017-10-03
发明(设计)人: 丁帅;杨善林;蔡琼;徐健;潘禹辰;牛锋 申请(专利权)人: 合肥工业大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 安徽省合肥新安专利代理有限责任公司34101 代理人: 陆丽莉,何梅生
地址: 230009 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 社区 管理 服务 数据处理系统 及其 处理 方法
【说明书】:

技术领域

发明涉及大数据处理分析,特别是涉及针对社区管理服务的大数据处理系统及方法。

背景技术

社区管理是社会治理的细胞,是国家治理体系和治理能力现代化建设的重要基础。互联网尤其是移动互联网在社区管理服务中的广泛应用,以及社交网络、智慧城市等新型信息源的不断涌现,催生了多源、动态、海量、异构的社区管理服务大数据。

目前主流的大数据计算方法为开源分布式计算平台Hadoop,其核心为分布式文件系统HDFS与编程模型MapReduce。虽然Mapreduce擅长处理半结构化数据与结构化数据,然而针对特定需求的数据处理任务效率低下,面对社区管理服务大数据对时效性要求高的问题尚未形成良好的解决办法,也没有形成完整的冗余数据集成机制,为开发社区管理服务大数据的潜在价值带来了不便。

发明内容

本发明是为了克服现有技术存在的不足之处,提供一种社区管理服务大数据处理系统及其处理方法,以期能形成面向社区管理服务的半结构化数据和结构化数据的采集机制,针对具有不同时效性的社区管理服务大数据形成高效的存储机制,为解决社区管理服务大数据冗余性高的问题形成完整的集成机制,从而提升社区管理服务大数据的处理效率。

本发明为达到上述目的所采用的技术方案是:

本发明一种社区管理服务大数据处理系统的特点包括:社区管理服务数据库、数据收集系统和数据集成系统;

所述数据收集系统包括半结构化数据采集模块和结构化数据采集模块;所述半结构化数据采集模块用于对社区管理服务的HTML格式数据进行定向采集,获得半结构化数据;所述结构化数据采集模块对社区管理服务数据库的数据进行定向采集,获得结构化数据;

所述数据集成系统包括数据转换模块和数据融合模块;所述数据转换模块将所述半结构化数据转换为新结构化数据,所述数据融合模块对结构化数据和新结构化数据进行基于关键字的整合处理,获得社区管理服务的结构化数据。

本发明一种社区管理服务大数据处理系统的处理方法的特点是按如下步骤进行:

步骤1、获得半结构化数据并进行存储;

步骤1.1、构建用于临时存储半结构化数据的XML模板文档;

步骤1.2、利用筛选器对社区管理服务的HTML格式数据进行解析并定向抓取;获得半结构化数据;将所述半结构化数据存入所述XML模板文档中;

步骤2、获得长期存储数据并进行存储;

步骤2.1、对社区管理服务数据库中的任意长期存储数据进行定向采集,获得第v个长期结构化数据,记为表示所述第v个长期结构化数据Av中第i个的元素;1≤i≤n;1≤v≤V;V表示所述长期存储数据的总数;

步骤2.2、创建用于存储所述第v个长期结构化数据Av的第一数据链栈与第二数据链栈

步骤2.3、根据所述第v个长期结构化数据Av的生成时间将所述第v个长期结构化数据Av依次存入所述第一数据链栈并用元素属性Date来表示所述第v个长期结构化数据Av的生成时间,记为表示所述第v个长期结构化数据Av中第i个的元素的生成时间;

步骤2.4、初始化i=1;则所述第一数据链栈中第i个元素表示栈顶元素;

步骤2.5、令指针指向所述第i个元素

步骤2.6、将所述第i个元素的生成时间与时间阈值A进行比较;在所述第i个元素生成时间大于所述时间阈值A时,取出所述第i个元素并压入到所述第二数据链栈中;并将i+1赋给i后,返回步骤2.5顺序执行;从而利用所述第二数据链栈完成长期存储数据的存储;并形成第v个长期存储数据表,进而获得V个长期存储数据表;

步骤3、获得临时存储数据并进行存储;

步骤3.1、根据设定周期对所述社区管理服务数据库中的临时存储数据进行定向采集,获得临时结构化数据;

步骤3.2、创建容量为S的队列Queue1;

步骤3.3、将所述临时存储数据压入所述队列Queue1;

步骤3.4、用元素数据Data来表示存放在所述社区管理服务数据库中的其他临时存储数据;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510070156.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top