[发明专利]一种房地产公众预期大数据处理方法及系统有效
申请号: | 201810146733.4 | 申请日: | 2018-02-12 |
公开(公告)号: | CN108304568B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 董纪昌;郑长敬;李秀婷;刘颖;董志 | 申请(专利权)人: | 郑长敬 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/953;G06F16/36;G06F16/335;G06Q30/02;G06Q50/16 |
代理公司: | 北京酷爱智慧知识产权代理有限公司 11514 | 代理人: | 高江玲 |
地址: | 100040 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 房地产 公众 预期 数据处理 方法 系统 | ||
本发明公开了一种房地产公众预期大数据处理方法,构建基于大数据的房地产市场的情绪词典;通过网络爬虫获取原始数据;对原始数据进行数据清洗及筛选处理;根据关键词数据库及房地产公众情感分析数据库建立房地产公众预期训练模型;通过网络爬虫获取待处理数据;将待处理数据输入训练模型进行训练;对待处理数据进行分类,构建房地产公众预期指数,预测房地产大数据与房地产公众预期指数的相关性。本发明的有益效果在于:实现实时预测不同的媒介和不同的机构与房地产公众预期指数的相关性。以客观、完整的视角实现对全样本的数据分析,充分聚焦不同机构和不同媒介,对不同机构和不同媒介的房地产公众预期差异进行细致、专业分析。
技术领域
本发明涉及大数据处理技术领域,具体涉及一种房地产公众预期大数据处 理方法及系统。
背景技术
目前,房地产行业的背景主要包括以下几个方面:
(1)外部环境因素的不确定性和复杂性:通过公众预期的调整,进一步影 响房地产市场波动,这种不确定性越大,由预期引致的市场波动也将越为剧烈。 现有文献对房地产公众预期的度量大多是选用外推方法和计量经济模型,少部 分用了统计调查方法,但这些度量指标受限于数据可获性,一般更新频度不高。 公众预期具有弹性大、不稳定等特征,对其度量指标的实时性要求较高,不能 有效测度。现有研究大多是基于适应性预期或理性预期框架,以经济主体完全 理性为前提假设,较少考虑非理性因素对预期形成、影响等方面的作用,不利 于有效管理公众预期。
(2)有效管理市场:公众预期管理是政策制定者最为重视的目标之一。研 究公众预期的测度、形成及其对房地产市场的作用机理,有助于政府有效实施 房地产调控,合理管理房地产公众预期和主体行为。
基于上述房地产行业的现状,有必要开展大数据环境下、房地产公众预期 的研究。
发明内容
针对现有技术中的缺陷,本发明的目的之一在于提供一种房地产公众预期 大数据处理方法,实时反映不同媒介、不同机构、不同群体对于房地产市场的 预期差异及变化。
本发明的目的之一在于提供一种房地产公众预期大数据处理系统,实时反 映不同媒介、不同机构、不同群体对于房地产市场的预期差异及变化。
第一方面,本发明提供的房地产公众预期大数据处理方法,包括:
构建基于大数据的房地产市场的情绪词典,所述情绪词典中包含多种情绪 信息;
通过网络爬虫获取原始数据,所述原始数据包括微博数据、网页数据、论 坛数据以及贴吧数据;
对所述原始数据进行数据清洗及筛选处理,以得到关键词数据库及房地产 公众情感分析数据库;
根据所述关键词数据库及房地产公众情感分析数据库建立房地产公众预 期训练模型;
通过网络爬虫获取待处理数据,所述待处理数据包括微博数据、网页数据、 论坛数据以及贴吧数据;
将所述待处理数据输入所述训练模型进行训练;
对所述待处理数据进行分类,构建房地产公众预期指数,预测房地产大数 据与房地产公众预期指数的相关性。
可选地,对所述原始数据进行数据清洗及筛选处理,以得到关键词数据库 具体包括:
采用文本处理技术对原始数据进行去噪、解析和分词,得到文本数据;
采用数据挖掘技术分析文本数据的属性,得到清洗数据;
针对不同地区设置影响因素,根据不同地区的影响因素对所述清洗数据进 行筛选,得到初始数据;
根据地区下属的管辖区域对初始数据进行扩充,得到扩充数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑长敬,未经郑长敬许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810146733.4/2.html,转载请声明来源钻瓜专利网。