[发明专利]一种基于社交媒体数据的自然灾害损失实时评估方法有效
| 申请号: | 201810787884.8 | 申请日: | 2018-07-18 |
| 公开(公告)号: | CN109063983B | 公开(公告)日: | 2022-06-21 |
| 发明(设计)人: | 赵吉昌;宁云州;盛浩 | 申请(专利权)人: | 北京航空航天大学 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F16/215 |
| 代理公司: | 北京中创阳光知识产权代理有限责任公司 11003 | 代理人: | 尹振启 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 社交 媒体 数据 自然灾害 损失 实时 评估 方法 | ||
一种基于社交媒体数据的自然灾害损失实时评估方法,具体包括以下步骤:步骤1,以自然灾害为关键词获取社交媒体文本数据;步骤2,提取文本数据,并对数据进行处理,以完成文本数据的分词与情绪标定;步骤3,建立自然灾害相关词库和反词库;步骤4,基于自然灾害相关词库和反词库词库以及社交媒体数据的地理信息对文本数据进行清洗;步骤5,设置分析期,获取分析期的自然灾害的历史灾情数据,建立多元线性回归模型,进行迭代计算直至模型系数的显著性水平小于设定阈值。
技术领域
本发明涉及一种评估方法,尤其涉及一种基于社交媒体数据的自然灾害损失实时评估方法。
背景技术
自然灾害损失评估对于灾害的防治及抢险救灾工作十分重要,它是救灾的人力、财力和物力分配的依据,同时也是补助资金和保险赔偿的依据,对防灾减灾资金投入的方向、数量和工程规模的确定起着决定性的作用。在众多评价自然灾害损失的指标中,直接经济损失是救灾工作的最重要依据。围绕着评估自然灾害直接经济损失这一目标,现有技术的评估方法大多为灾害发生之后进行的实测性评估,虽然相对准确,但是需要耗费大量的时间、人力和物力,且存在时间滞后、重复计算及夸大灾情等问题。
随着社交媒体日益融入每个人的日常生活,一旦发生自然灾害,将会有大批网民自发地在社交媒体上发表灾害相关的各类信息并表达自己的情绪。该过程可以理解为一种社会感知,即所有网民均是“传感器”,能够感知周围的事件并通过社交媒体扩散相关信息。与传统媒体不同的是,社交媒体使得数据收集的速度和广度都达到了前所未有的级别,这就使得通过社交媒体数据对自然灾害进行实时评估成为可能,本发明正是基于这一背景,提出了一种基于社交媒体数据的自然灾害损失实时评估方法,能够弥补传统评估方法的不足,为抢险救灾等工作提供早期的决策支持。
发明内容
一种基于社交媒体数据的自然灾害损失实时评估方法,具体包括以下步骤:步骤1,以自然灾害为关键词获取社交媒体文本数据;步骤2,提取文本数据,并对数据进行处理,以完成文本数据的分词与情绪标定;步骤3,建立自然灾害相关词库和反词库;步骤4,基于自然灾害相关词库和反词库词库以及社交媒体数据的地理信息对文本数据进行清洗;步骤5,设置分析期,获取分析期的自然灾害的历史灾情数据,建立多元线性回归模型,进行迭代计算直至模型系数的显著性水平小于设定阈值。
与现有技术相比,本发明的有益效果在于:
本模型为数据驱动型模型,且基于大规模社交媒体数据。在社交媒体日渐融入人们日常生活的背景下,本模型的数据收集方便、灵活、及时,进而能够保证实时评估的数据来源与高度可行性。
本发明建立的损失实时估计模型是可验证的。利用历史数据对该估计模型进行评价,发现该模型具有良好的统计学意义和拟合效果,模型的有效性较高。
本发明建立的损失估计方法易于计算并快速实时。有别于其他常见的自然灾害损失评估方法,本发明采用分析期内各省级行政区社交媒体数据文本按情绪分类后的数量作为自变量建立模型,算法思路新颖,且因为社交媒体数据快速、实时的特性可以实现对于自然灾害损失的实时评估,大大提高了损失评估的速度,使实时的自然灾害损失评估成为可能,继而为抢险救灾等工作提供早期的决策支持。
本发明建立了灾害相关词库和灾害反词库。不但能够基于这两个词库进行数据清洗并取得良好的清洗效果,这两个词库本身还能够用于对自然灾害的进一步分析和理解。
本发明在建立词库的过程中使用了高频共现的方法和第三方词库的补充。在保证自然灾害相关词库广度的同时,节省了人工标注或添加的成本,大大加快了词库建立的速度。
附图说明
图1为本发明的整体流程图;
图2为本发明一实施例的迭代前的多元线性回归模型详情表;
图3为本发明一实施例的迭代后多元线性回归模型详情表。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810787884.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





