[发明专利]一种基于机器学习的斜拉桥非结构化监测数据处理方法在审

申请号：	201910561286.3	申请日：	2019-06-26
公开（公告）号：	CN110781333A	公开（公告）日：	2020-02-11
发明（设计）人：	陈宇轩;何显银;宋杰;董梅;胡辉	申请（专利权）人：	杭州鲁尔物联科技有限公司
主分类号：	G06F16/56	分类号：	G06F16/56;G06F16/583;G06N3/04;G06N3/08
代理公司：	33109 杭州杭诚专利事务所有限公司	代理人：	尉伟敏
地址：	310012 浙江省杭州市西***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	非结构化评价模型桥梁检测特征向量文本数据词向量非结构化数据计算能力要求监测数据处理神经网络算法提取图像数据实质性效果处理流程基于机器模型生成算法训练随机森林图像数据原始数据斜拉桥准确率拼接分析学习图片
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于机器学习的斜拉桥非结构化监测数据处理方法，其特征在于，包括以下步骤：

S1：从原始数据中提取图像数据及所需文本数据；

S2：对文本数据采用Word2Vec模型生成词向量，对图像数据采用神经网络算法生成图片的特征向量；

S3：将词向量及特征向量拼接，通过随机森林算法训练，得到评分模型。

2.根据权利要求1所述的一种基于机器学习的斜拉桥非结构化监测数据处理方法，其特征在于，所述步骤S1中文本数据的提取过程包括：采用正则化方法并对原始数据进行匹配，提取出所需的文本数据。

3.根据权利要求1或2所述的一种基于机器学习的斜拉桥非结构化监测数据处理方法，其特征在于，所述步骤S2中词向量的生成过程包括：利用one-hot编码将单词对转化为数字的形式；定义只有一个隐含层的神经网络结构；定义损失函数；选择合适的优化器；迭代训练；储存训练好的网络，得到词向量。

4.根据权利要求3所述的一种基于机器学习的斜拉桥非结构化监测数据处理方法，其特征在于，所述步骤S2中特征向量的生成过程包括：输入层数据去均值，归一化处理；卷积层特征提取，卷积共享，降低噪声；降采样层利用局部相关性减少计算量；全连接层利用softmax激励函数，获得激活值；计算损失函数；误差向后传播，调整各层权重；获得训练好的模型，得到特征向量。

5.根据权利要求1或2所述的一种基于机器学习的斜拉桥非结构化监测数据处理方法，其特征在于，所述步骤S3中的随机森林算法为ID3.0型决策树算法，包括：准备好拼接完成的向量样本数据集；计算各个特征划分后的熵增大小；选择最大熵增的特征对样本数据集进行划分，得到划分后的数据；在剩下的特征里选择熵增最大的特征，迭代划分，直至样本集被完全分类；建立多个决策树共同决策；存储训练好的模型。

6.根据权利要求1或2所述的一种基于机器学习的斜拉桥非结构化监测数据处理方法，其特征在于，所述步骤S1中的原始数据为桥梁检测报告。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于杭州鲁尔物联科技有限公司，未经杭州鲁尔物联科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910561286.3/1.html，转载请声明来源钻瓜专利网。

上一篇：基于复合聚类算法的电力居民用户日负荷曲线聚类方法
下一篇：信息处理设备和信息处理方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于机器学习的斜拉桥非结构化监测数据处理方法在审

专利文献下载