[发明专利]一种基于多维数据模型的舆情发生时序分析方法在审
申请号: | 202110270374.5 | 申请日: | 2021-03-12 |
公开(公告)号: | CN112988783A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 李涛;于宝瑞;芇禄飞;王艳明;吴晓;时坤;裴天飞;李欣;董蒙;张帅;腾俊章;吴量;杨乐;陈丽丽;程彪;王凯;王星亮 | 申请(专利权)人: | 李涛 |
主分类号: | G06F16/242 | 分类号: | G06F16/242;G06F16/2458;G06F16/28 |
代理公司: | 苏州企航知识产权代理事务所(普通合伙) 32354 | 代理人: | 朱丹 |
地址: | 250000 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多维 数据模型 舆情 发生 时序 分析 方法 | ||
本发明提出了一种基于多维数据模型的舆情发生时序分析方法,包括S1:数据源分析;S2:确定主题域;S3:确定维度:在综合数据库内按业务主题建立主题域,对从各业务数据库中抽取过来的数据进行组织和汇总并存储数据,同时需要根据不同用户观察数据的角度,划分维度层次,确定每一个维度的垂直汇总路径,本方法采用了比较成熟的建立多维数据模型方法,对舆情发生的时序进行分析,以舆情时间维度设计,并作为类聚中心,通过矩阵形式快速定位数据,并能够有效的并预测舆情未来发展趋势。
技术领域
本发明涉及数据自动分析领域,尤其涉及基于基于多维数据模型的舆情发生时序分析方法。
背景技术
在当今信息化建设日益蓬勃的潮流下,舆情数据信息量越来越向复杂化、爆炸式、超大规模化的方向发展,要在大量的舆情历史数据中来发掘潜在的舆情发展趋势,采用传统的数据统计分析手段,显然在高效要求的今天,已经显得不切实际了,而现有的舆情分析方法,如专利公布号为:CN 107741929 A的发明专利公开的舆情分析方法及装置使用的是关键词的方式,并通过关键词来搜索舆情内容,但是该种方式针对舆情的发展趋势是难以预测的。
发明内容
为解决上述技术问题,本发明提出了一种基于多维数据模型的舆情发生时序分析方法,包括
S1:数据源分析:建立统一信息标准,保证全部信息编码一致,并保证各异构数据库的数据非空;
S2:确定主题域:使用自下而上的方式确定主题域,按各业务主题域划分进行建模,根据需要从各业务数据库抽取数据,将数据按划分好的主线模式存储,保证相关之间具备较强的逻辑关联;
S3:确定维度:在综合数据库内按业务主题建立主题域,对从各业务数据库中抽取过来的数据进行组织和汇总并存储数据,同时需要根据不同用户观察数据的角度,划分维度层次,确定每一个维度的垂直汇总路径。
优选的,通过存储模块记录多维数据表,包含数据记录行数。
优选的,确定时间维度,采用时间序列数据进行聚类操作。
优选的,所述以年、季度、月、旬、日、时、分、秒作为聚类中心。
优选的,使用向量A,表示时间数据集合,A=[a1,a2,a3,……,an],an为第n个时间点,向量B,表示时间数据聚类中心集合,B=[b1,b2,b3,……,b8],其中b1=年,b2=季度,b3=月,b4=旬,b5=日,b6=时,b7=分,b8=秒。
优选的,确定矩阵C,表示以B为聚类因子对时间向量A聚类后的得到的时间维度数据集合。Ci=[Ci1,Ci2,……Ci8]T(i=1……n),cij表示以聚类因子bj对元素ai聚类后得到的时间值。
优选的,通过时间维度聚类处理,建立事件数量的序列多维数据模型。
优选的,选用OLAP图形化分析工具,根据分析者的任意目的和主题选择相应时间维度组合,对事件数量进行不同角度不同粒度的观察和分析,最后在前端采用图表的形式显示分析结果。
本发明提出的基于多维数据模型的舆情发生时序分析方法有以下有益效果:本方法采用了比较成熟的建立多维数据模型方法,对舆情发生的时序进行分析,以舆情时间维度设计,并作为类聚中心,通过矩阵形式快速定位数据,并能够有效的并预测舆情未来发展趋势。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍。
图1为本发明的疫苗发布数量时间序列多维数据模型示意图;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李涛,未经李涛许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110270374.5/2.html,转载请声明来源钻瓜专利网。