[发明专利]一种基于多模态信息融合的仓租价格预测方法在审
| 申请号: | 202011181801.4 | 申请日: | 2020-10-29 |
| 公开(公告)号: | CN112232885A | 公开(公告)日: | 2021-01-15 |
| 发明(设计)人: | 熊海涛;刘鑫 | 申请(专利权)人: | 北京工商大学 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06;G06F16/29;G06F16/951;G06F16/9537;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽 |
| 地址: | 100048*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多模态 信息 融合 租价 预测 方法 | ||
本发明公开了一种基于多模态信息融合的仓租价格预测方法,该方法包括:(1)获取仓库结构化信息、仓库地理位置信息和仓库实景图像多模态信息;(2)数据预处理:对于结构化信息进行异常数据剔除、独热编码等处理;(3)对于地理位置信息进行K‑means聚类分析;(4)对于实景图像利用二阶段CNN(Two‑stage CNN)模型进行特征提取;(5)基于步骤1至4,构建包含结构化信息、地理位置信息、仓库实景图像的多模态信息的特征数据集,并利用XGBoost模型进行训练拟合,以获得仓租价格的预测。相比于传统的价格预测模型,通过使用单模态和多模态信息的对比试验可知,使用多模态信息融合的预测方式,更加有利于仓租价格的预测,本发明具有精确度高、泛化能力强的特点。
技术领域
本发明涉及数据预测技术领域,尤其是一种基于多模态信息融合的仓租价格预测方法。
背景技术
仓储需求增加。随着国家经济高速发展,企业对仓储的需求也越来越高。如果能够快速而准确的评估出仓租的价格,有利于在交易中进行更好的交易判断,消除信息不对称对市场造成的影响,同时也有利于帮助企业降低仓储成本,选择一个成本最低、收益最大的仓储方案,开展经营。
结构化信息中易存在虚假信息。目前,关于价格预测的方法有很多,传统方法多是仅根据结构化信息进行预测,但是在仓租价格预测的问题上,传统方法并不适用,因为仓租价格不像一般房屋价格似的比较透明,有些出租方可能会发布虚假信息以获得更高利益,比如虚报消防等级、停车的便利性等等,因此这些虚假信息会大大影响仅根据结构化信息构建的价格预测模型的准确度。
仓库租赁中介网站的信息多模态化。随着计算机技术的不断发展,仓库租赁中介网站的信息也在不断增多,不仅包含了仓库面积、价格、层高等传统结构化信息,还包括了仓库地理位置、仓库实景图像等多模态信息,如果能合理的处理这些多模态信息,就能得到更丰富的特征,从而构建更加精准的预测模型。
组合学习算法应用火热。组合学习就是组合多个弱监督模型以期得到一个更好更全面的强监督模型,本文主要应用的是一种基于决策树(GBDT)的组合学习算法——XGBoost(eXtreme Gradient Boosting)算法,该算法是由陈天奇博士在2016年提出的,XGBoost的根本思想是训练多个弱决策树并使之串联形成一个较强决策树,每个决策树的分类效果可能不是特别好,但是多个决策树串联肯定会得到更准确的结果。因此基于它效果好、对于输入要求不敏感等优点,往往是从统计学家到数据科学家必备的工具之一,它同时也是kaggle比赛优胜选手最常用的工具之一。
发明内容
本发明技术解决问题:克服现有技术的不足,提供一种基于多模态信息融合的仓租价格预测方法,相较于传统价格预测方法,本方法精准度更高、拟合效果更好,具有精确度高、泛化能力强的优点。
本发明解决其技术问题所采用的技术方案是:一种基于多模态信息融合的仓租价格预测方法,包括以下步骤:
步骤1:利用网络爬虫程序从仓库租赁中介网站中获取多模态信息,所述多模态信息包括:仓库结构化信息、仓库地理位置信息和仓库实景图像;
步骤2:数据预处理:对仓库结构化信息进行去重、缺失值处理、异常数据剔除、独热编码处理,结构化信息中的仓库租金单价采用离散区间表示,提取出结构化特征;
步骤3:根据仓库地理位置信息,获取仓库经纬度,并对经纬度数据进行K-means聚类分析,以提取出地理位置特征;
步骤4:对于仓库实景图像,利用二阶段CNN(Two-stage CNN)模型对仓库实景图像进行分类,以提取出实景图像特征;
步骤5:将步骤2的结构化特征、步骤3的地理位置特征和步骤4实景图像特征进行特征数据整合,构建包括仓库结构化信息、仓库地理位置信息、仓库实景图像的多模态信息的特征数据集,并利用XGBoost模型进行训练拟合,获得仓租价格的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011181801.4/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





