[发明专利]基于深度迁移学习的房地产市场分析方法、装置及设备有效
| 申请号: | 202010588072.8 | 申请日: | 2020-06-24 |
| 公开(公告)号: | CN111813893B | 公开(公告)日: | 2022-11-18 |
| 发明(设计)人: | 许国良;顾桐;洪岩;韩茂林;王铎;雒江涛;代朝东 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F16/951;G06K9/62;G06N3/04;G06N3/08;G06F40/289;G06F40/30 |
| 代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
| 地址: | 400065 重*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 深度 迁移 学习 房地产 市场分析 方法 装置 设备 | ||
1.基于深度迁移学习的房地产市场分析方法,其特征在于,具体包括以下步骤:
采集房地产网络舆情数据,并对舆情数据进行预处理;
构建一个融入变分信息瓶颈的深度多通道神经网络;
利用相关领域中大量的标注数据对网络进行预训练;
通过迁移学习的方式,使用少量已标注的舆情数据对预先建立的网络进行微调;
在所述迁移后的网络上对未标注的房地产舆情数据进行情感倾向分析,并获得最终的房地产市场情绪分析结果。
2.根据权利要求1所述的基于深度迁移学习的房地产市场分析方法,其特征在于,对舆情数据进行预处理至少包括去除重复数据、特殊符号,并结合领域知识对少量数据进行情感极性标注。
3.根据权利要求1所述的基于深度迁移学习的房地产市场分析方法,其特征在于,融入变分信息瓶颈的深度多通道神经网络包括上下文信息提取模块、局部特征提取模块、特征融合模块、特征压缩模块、情感输出模块,其中,上下文信息提取模块通过多个双向门限循环单元Bi-GRU提取文本的上下文信息;局部特征提取模块通过多个不同大小卷积核的卷积神经网络CNN提取局部特征。
4.根据权利要求3所述的基于深度迁移学习的房地产市场分析方法,其特征在于,Bi-GRU提取文本的上下文信息表示为:
其中,xt为t时刻的输入,为单向GRU的权重矩阵,Wy为连接两层的权重矩阵,为单向GRU的偏置项,by为连接两层的偏置项,σ为激活函数,和分别为前向GRU与后向GRU的输出,yt为t时刻的输出。
5.根据权利要求3所述的基于深度迁移学习的房地产市场分析方法,其特征在于,通过多个不同大小卷积核的CNN提取局部特征包括:
第i个通道卷积操作所使用的卷积核为w∈Rh,其中h为卷积核大小,控制卷积单词的个数,则提取后的第j个新特征cij表示为:cij=f(w·xj:j+h-1+b);
卷积核沿着每一个词窗口{x1:h,x2:h+1,xn-h+1:n}逐步滑动,所产生的特征序列表示为:ci=[ci,1,ci,2,…,ci,n-h+1];
利用池化操作来减少经卷积产生的维数,获得的特征表示为:c′i=max(ci,1,ci,2,…,ci,n-h+1);
其中,w为权重矩阵,b为偏置项,f为卷积核函数,xj:j+h-1为h个词构成的局部词窗口,n为一条文本的单词总数。
6.根据权利要求3所述的基于深度迁移学习的房地产市场分析方法,其特征在于,特征融合模块将多个通道生成的特征序列连接起来以形成融合后特征序列c,假设总共有k个通道,则融合后的特征序列可表示为:c=[c′1,c′2,…,c’k]。
7.根据权利要求3所述的基于深度迁移学习的房地产市场分析方法,其特征在于,特征压缩模块利用变分信息瓶颈对语义进行压缩,对于一个信息X={x1,x2,…,xn},其特征变量为Y={y1,y2,…,ym},通过中间变量Z={z1,z2,…,zl}来表示X,使Z尽可能地压缩X的信息,同时尽可能保留相关的特征信息Y,即让X与Z的互信息I(X,Z)最小,Y与Z的互信息I(Y,Z)最大。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010588072.8/1.html,转载请声明来源钻瓜专利网。





