[发明专利]计算房源相似度的方法、装置、设备及存储介质有效
申请号: | 201810042038.3 | 申请日: | 2018-01-16 |
公开(公告)号: | CN108256067B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 王韬;孙朋伟;韦柏松;徐蓓;侯斯靓;胡海亮 | 申请(专利权)人: | 平安好房(上海)电子商务有限公司 |
主分类号: | G06F16/955 | 分类号: | G06F16/955;G06F16/9535;G06Q50/16 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 200000 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 房源 相似 方法 装置 设备 存储 介质 | ||
本发明公开了一种计算房源相似度的方法,所述方法包括以下步骤:获取用户房源图像,并提取所述用户房源图像中的房源特征标签;根据所述房源特征标签爬取房源数据;计算房源特征标签与爬取到的房源数据之间的相似度;将相似度大于或等于预设值的房源数据向用户进行推送。本发明还公开了一种计算房源相似度的装置、设备及计算机可读存储介质。本发明能够根据用户需求进行推送房源,减轻用户找房的负担,节省用户找房时间。
技术领域
本发明涉及数据分析与处理领域,尤其涉及一种计算房源相似度的方法、装置、设备及计算机可读存储介质。
背景技术
随着互联网的进步,人们在需要购买房子或者租赁房子时,越来越倾向于在网上进行查找房源,从而缩短查找房源的时间,提高查找房源的效率。
但目前市面上的房产信息平台通常采用的是用户主动搜索、筛选等方式,完全由用户主动来寻找适合自己的房源,而房产信息平台上的房源较多,这种方式通过用户自动搜索、筛选对用户而已费时费力,并且大量房源被淹没在海量数据中,而符合用户需求的房源无法快速到达用户。部分平台虽然也存在推荐但只是热门房源推荐,热门房源并不一定是用户需要的房源,而用户而言,推送并不智能,而如果采用人工介入,分析用户需要的房源,然后进行推送,会导致网站的运营成本变高。
发明内容
本发明的主要目的在于提出一种计算房源相似度的方法、装置、设备及计算机可读存储介质,旨在解决现有的房源推送不智能,而采用人工进行推送,会导致成本升高的技术问题。
为实现上述目的,本发明提供一种计算房源相似度的方法,所述方法包括:
获取用户房源画像,并提取所述用户房源画像中的房源特征标签;
根据所述房源特征标签爬取房源数据;
计算房源特征标签与爬取到的房源数据之间的相似度;
将相似度大于或等于预设值的房源数据向用户进行推送。
进一步地,所述计算的房源特征标签与爬取到的房源数据之间的相似度的步骤包括:
将所述房源特征标签转化为特征偏好权重组成的房源特征标签向量,并将所述房源数据转化为房源数据特征向量;
计算房源特征标签向量与房源数据特征向量之间的相似度。
进一步地,根据以下公式计算所述相似度:
其中,所述x为房源特征标签向量,y为房源数据特征向量,c1c2为预设系数。
进一步地,所述根据所述房源特征标签爬取房源数据的步骤包括:
启动系统中添加的数据采集器,根据接收到的房源特征标签,选取房源数据;
将选取到的房源数据进行下载保存,获得房源数据。
进一步地,所述将相似度大于或等于预设值的房源数据向用户进行推送的步骤包括:
将相似度大于或等于预设值的房源数据进行相似度排序,获得排序后的房源待推荐清单;
将房源待推荐清单上的房源向用户进行推送。
进一步地,所述获取用户房源图像的步骤之前,还包括:
获取用户在房源系统中填写资料记录以及浏览记录;
通过所述填写资料记录获取用户填写的资料,通过所述浏览记录获取用户浏览的房源数据;
根据所述用户填写的数据以及房源数据提取用户房源特征标签;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安好房(上海)电子商务有限公司,未经平安好房(上海)电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810042038.3/2.html,转载请声明来源钻瓜专利网。