[发明专利]一种基于多模态信息融合的仓租价格预测方法在审
| 申请号: | 202011181801.4 | 申请日: | 2020-10-29 |
| 公开(公告)号: | CN112232885A | 公开(公告)日: | 2021-01-15 |
| 发明(设计)人: | 熊海涛;刘鑫 | 申请(专利权)人: | 北京工商大学 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06Q30/06;G06F16/29;G06F16/951;G06F16/9537;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽 |
| 地址: | 100048*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多模态 信息 融合 租价 预测 方法 | ||
1.一种基于多模态信息融合的仓租价格预测方法,其特征在于,包括以下步骤:
步骤1:利用网络爬虫程序从仓库租赁中介网站中获取多模态信息,所述多模态信息包括:仓库结构化信息、仓库地理位置信息和仓库实景图像;
步骤2:数据预处理:对仓库结构化信息进行去重、缺失值处理、异常数据剔除、独热编码处理,结构化信息中的仓库租金单价采用离散区间表示,提取出结构化特征;
步骤3:根据仓库地理位置信息,获取仓库经纬度,并对经纬度数据进行K-means聚类分析,以提取出地理位置特征;
步骤4:对于仓库实景图像,利用二阶段CNN(Two-stage CNN)模型对仓库实景图像进行分类,以提取出实景图像特征;
步骤5:将步骤2的结构化特征、步骤3的地理位置特征和步骤4实景图像特征进行特征数据整合,构建包括仓库结构化信息、仓库地理位置信息、仓库实景图像的多模态信息的特征数据集,并利用XGBoost模型进行训练拟合,获得仓租价格的预测结果。
2.根据权利要求1所述的一种基于多模态信息融合的仓租价格预测方法,其特征在于:所述步骤1中具体包括:
步骤1.1:仓库结构化信息包括:仓库编号、仓库名称、仓库租金单价、仓库面积、是否可环评、是否可注册、是否有产证、有无排污证、消防等级、最大用电量、最小分割面积、最短租期、房源结构、共几层、所在层、所在层高、物业费、是否有停车位、有无办公区和有无卸货平台;
步骤1.2:仓库地理位置信息以经度、纬度的形式保存;
步骤1.3:仓库实景图像按照仓库编号储存在对应文件夹内,方便后续模型的使用。
3.根据权利要求1所述的一种基于多模态信息融合的仓租价格预测方法,其特征在于:所述步骤2中,仓库结构化信息中重复的数据进行删除;特征缺失在30%以下的数据采用众数填充,如果特征缺失在50%以上,则删除特征;剔除价格为0、面积为0的数据;对于字符型变量,包括是否可环评、是否可注册、是否有产证、有无排污证、房源结构、是否有停车位、有无办公区和有无卸货平台,采用独热编码处理,转变为数值型变量;为了提高模型预测的精准度,仓库租金单价采用离散区间表示,分成n个仓租价格等级,在具体实施方案中可合理设置仓租价格等级n的数值。
4.根据权利要求1所述的一种基于多模态信息融合的仓租价格预测方法,其特征在于:所述步骤3中,仓库地理位置信息以经度、纬度的形式保存后,将数据代入K-means聚类算法中,从而提取出地理位置特征,实现流程如下:
步骤3.1:设输入的数据样本为S={s1,s2,...,sm},每个样本si都包含经度、纬度两种属性{si1,si2};
步骤3.2:随机选择k个聚类中心{a1,a2,...,ak},1k≤m,然后计算每个样本到每个聚类中心的欧式距离,即:
其中,si表示第i个样本1≤i≤m,aj表示第j个聚类中心1≤j≤k,si1、si2表示样本si的经度、纬度,aj1、aj2表示聚类中心aj的经度、纬度;
步骤3.3:依次比较每个样本到聚类中心的距离,并选择最小值作为该样本的所属类别;
步骤3.4:在每个类簇中,计算数据对象的均值从而得到新的聚类中心,即:
其中m为样本属性;
步骤3.5:重复上述步骤3.3与步骤3.4,直到结果趋于收敛。
终止条件:迭代次数,簇中心变化率,最小平方误差MSE。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011181801.4/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





