[发明专利]一种基于知识图谱构建的滑坡风险预测方法及系统有效
| 申请号: | 202010516705.4 | 申请日: | 2020-06-09 |
| 公开(公告)号: | CN111639878B | 公开(公告)日: | 2023-05-26 |
| 发明(设计)人: | 马连博;王经纬;王兴伟;朱万成;张鹏海 | 申请(专利权)人: | 东北大学 |
| 主分类号: | G06Q10/0635 | 分类号: | G06Q10/0635;G06Q10/04;G06F16/36;G06F16/35;G06F18/214 |
| 代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李运萍 |
| 地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 知识 图谱 构建 滑坡 风险 预测 方法 系统 | ||
1.一种基于知识图谱构建的滑坡风险预测方法,其特征在于,包括以下步骤:
步骤1:获得研究地区内发生的滑坡事件,分别统计每次滑坡事件发生时当地的相关地理地质因素属性值,所统计的属性包括:前后缘高程、滑体物质体积、滑体平均厚度、滑体物质组成、滑床岩性、岩层产状、斜坡坡向、斜坡类型、坡面形态、斜坡坡度;属性所对应的值为属性值,每次滑坡事件对应一组包含上述10个地理地质因素数据属性值的数据组,由所有的滑坡事件对应的所有数据组构成基础属性数据集;
步骤2:处理基础属性数据集中的数据;
步骤3:将步骤1中被统计的每次滑坡事件记为知识图谱中的一个实体,将这些实体命名为p1,p2,…,px,…,py,…,pn,这些表示滑坡事件的实体被定义为正样本,由正样本构成正样本集,记为pos={p1,p2,…,px,…,py,…,pn},将基础属性数据集中的数据组记为正样本集中对应实体的特征向量;
步骤4:设置滑体物质组成为自变量,将与其具有直接关联关系的地理地质因素属性值:前后缘高程属性值、滑体物质体积属性值、滑体平均厚度属性值、斜坡坡度属性值、斜坡类型属性值设置为因变量,将数据集中具有同一种滑体物质组成属性值所对应的数据组分为一组并以组为单位统计出每种因变量的取值范围;
步骤5:依据步骤4中统计出的取值范围和步骤1中统计出的每次滑坡事件的相关地理地质因素属性值,将步骤1所统计的每次滑坡事件对应的数据组分别对应生成一组表示不滑坡事件对应的新数据组,每次不滑坡事件也记为知识图谱中的一个实体,将这些实体命名为s1,s2,…,sx,…,sy,…,sn,这些表示不滑坡事件的实体被定义为负样本,由负样本构成负样本集,记为neg={s1,s2,…,sx,…,sy,…,sn},每组新数据组记为负样本集中对应实体的特征向量;
将所有新数据组加入到步骤1所得基础属性数据集中,生成新基础属性数据集;
步骤6:利用步骤5所生成新基础属性数据集中的数据组训练特征组合模型,再利用训练好的特征组合模型对每个数据组进行特征组合,经过特征组合之后,新基础属性数据集中每个特征向量的维度由原来的13维度变为39维度,这个39维的向量是实体的组合特征向量;
步骤7:生成知识图谱中关系的特征向量;
本方法构建的知识图谱中存在两种关系:相似、不相似;关系的特征向量的初始化值随机生成,特征向量的维度与实体的组合特征向量的维度相同,同为39;
若两个实体之间的关系为相似,表示两个实体同为滑坡事件或同为不滑坡事件,如果两个实体之间的关系为不相似,表示两个实体中一个为滑坡事件,另一个为不滑坡事件;
步骤8:构建三元组数据集;
步骤9:构建知识图谱模型,利用三元组数据集训练知识图谱模型;
步骤10:用训练好的知识图谱模型来预测待测地点的发生滑坡的概率,待测地点属于步骤1中所述研究地区;
所述步骤9还包括:
步骤9.1:将三元组与其对应生成的错误三元组输入进知识图谱模型;
三元组数据集中的每一个三元组,都是一个正确的三元组,首先根据这个正确的三元组生成一个错误的三元组;
生成错误三元组的方法如下,有以下几种情况:
若三元组的头实体属于正样本集pos,关系为相似,则从负样本集neg中随机选择一个替换原来的尾实体;
若三元组的头实体属于正样本集pos,关系为不相似,则从正样本集pos中随机选择一个替换原来的尾实体;
若三元组的头实体属于负样本集neg,关系为相似,则从正样本集pos中选择一个替换原来的尾实体;
若三元组的头实体属于负样本集neg,关系为不相似,则从负样本集neg中选择一个替换原来的尾实体;
将两种三元组输入进知识图谱模型;
步骤9.2:计算误差距离,得到预测结果
由知识图谱模型计算两种三元组的误差距离,三元组的误差距离通过对三元组中两个实体的组合特征向量与关系特征向量进行向量操作之后得到,具体计算公式如下:
dis=|h*w+r-t*w|(1)
其中w为一个39维的权重向量,其初始化数值随机生成,h表示三元组中的头实体的组合特征向量,t表示三元组中尾实体的组合特征向量,r表示三元组中关系的特征向量:
然后比较两个三元组的误差距离的大小,得到预测结果:知识图谱模型将误差距离小的三元组预测为正确的三元组;
步骤9.3:计算损失值
根据预测结果与真实结果计算误差值,这个误差值被定义为损失值;通过公式(1)分别计算得到正确三元组的误差距离dispos与错误三元组的误差距离disneg,若正确的三元组的误差距离小于错误三元组的误差距离,则知识图谱模型预测的结果是正确的,认为没有产生损失值;反之,则认为知识图谱的判断出错,将误差距离的差值作为损失值,计算公式如下:
loss=max{dispos-disneg,0}(2)
其中loss表示损失值,dispos表示正确三元组的误差距离,disneg表示错误三元组的误差距离;
步骤9.4知识图谱模型自动进行参数调整;
对步骤8中所得到的三元组数据集中的每一个三元组样本,重复进行上述步骤9.1到步骤9.4,直到损失值不再减小,训练结束,知识图谱模型构建完成;
在知识图谱模型训练结束之后,用它来判断一对实体之间的关系,判断方法如下:将这对实体的组合特征向量输入给知识图谱模型,知识图谱模型依据公式(1)分别计算实体对与两种关系:相似、不相似之间的误差距离,比较两个误差距离的大小,误差距离小的即为知识图谱模型预测出来的两实体之间的关系;
所述步骤10还包括:
依据步骤1中的所统计的地理地质因素属性,获得待测地点的相应属性的属性值;判断该地点滑坡发生的概率的步骤如下所述:
步骤10.1:依据步骤2中各属性值的处理方式对这组待测地点的属性值进行处理,得到当前这一新实体的特征向量;
步骤10.2:用步骤6中训练得到的特征组合模型对新实体的特征向量进行特征组合,得到新实体的组合特征向量;
步骤10.3:将这一新实体与正样本集中所有实体分别组成实体对,将它们的组合特征向量传递给知识图谱模型,知识图谱模型给出这一新实体与正样本集中所有实体之间的关系,统计出其中关系为相似的数量记为a,正样本中实体的数量记为n,比值a/n即为待测地点发生滑坡的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010516705.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:三维存储器的制作方法
- 下一篇:电子装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





