[发明专利]一种房产评估数据生成方法和装置在审
申请号: | 201710148148.3 | 申请日: | 2017-03-13 |
公开(公告)号: | CN108572988A | 公开(公告)日: | 2018-09-25 |
发明(设计)人: | 张亚楠;叶舟;王瑜;杨洋;苏飞 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06Q50/16 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地理区域 评估数据 随机森林 用户数据 电子商务平台 方法和装置 目标特征 影响因子 原始特征 决策树模型 价值评估 网页数据 申请 买方 参考 互联网 评估 支撑 | ||
本申请实施例提供了一种房产评估数据生成方法和装置,所述方法包括:获取地理区域内的用户数据和地理区域影响因子;从地理区域内的用户数据和地理区域影响因子中提取原始特征数据;从原始特征数据中选取目标特征数据;采用目标特征数据,生成随机森林模型;根据随机森林模型,生成地理区域的房产评估数据。本申请实施例中,根据电子商务平台的用户数据和从整个互联网的网页数据中爬取的可影响房产价值的数据,建立随机森林模型,根据随机森林模型中的决策树模型,生成房产评估数据。电子商务平台可以据此提供一种具有参考意义的房产评估数据,方便买方评估房产升值潜力,并给出支撑策略和规则,解决目前缺乏针对房产价值评估方式的问题。
技术领域
本申请涉及数据处理术领域,特别是涉及一种房产评估数据生成方法和一种房产评估数据生成装置。
背景技术
随着电子商务平台的发展,房产导购类目运营越来越成为电子商务平台的一个发力点。
目前,电子商务平台的房产导购类目运营,更多是通过活动推广(包括消费打折,团购打折等)来促进带看率和销量。但在这些活动推广中,电子商务平台无法给出针对房产价值的核心参考指标和升值分析策略,更多地是用户根据自身经验和相关评论来推测房产的价值,这些推测存在着片面性、局部性。
总之,目前的电子商务平台中缺乏针对房产价值评估方式。
发明内容
鉴于上述问题,提出了本申请实施例以便提供一种克服上述问题或者至少部分地解决上述问题的一种房产评估数据生成方法和相应的一种房产评估数据生成装置。
为了解决上述问题,本申请实施例公开了一种房产评估数据生成方法,包括:
获取地理区域内的用户数据和地理区域影响因子;
从所述地理区域内的用户数据和地理区域影响因子中提取原始特征数据;
从所述原始特征数据中选取目标特征数据;
采用所述目标特征数据,生成随机森林模型;
根据所述随机森林模型,生成所述地理区域的房产评估数据。
优选的,所述从所述原始特征数据中选取目标特征数据的步骤包括:
对所述原始特征数据进行预处理;
针对经过预处理的原始特征数据计算重要度参数;
根据所述重要度参数选取目标特征数据。
优选的,所述随机森林模型包括多个决策树模型,所述根据所述随机森林模型,生成所述地理区域的房产评估数据的步骤包括:
确定所述随机森林模型的决策树模型中的各个节点路径;
根据所述各个节点路径,生成所述地理区域的房产评估数据。
优选的,所述随机森林模型包括多个决策树模型,所述根据所述随机森林模型,生成所述地理区域的房产评估数据的步骤包括:
统计所述随机森林模型的决策树模型的各类叶子节点的数目;
计算同一类叶子节点的数目,与同一决策树模型中所有叶子节点的数目的比值;
根据所述比值,生成所述地理区域的房产评估数据。
优选的,所述从所述地理区域内的用户数据和地理区域影响因子中提取原始特征数据的步骤包括:
对所述地理区域内的用户数据和地理区域影响因子进行数据清洗;
针对清洗后的数据提取原始特征数据。
优选的,所述对所述地理区域内的用户数据和地理区域影响因子进行数据清洗的步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710148148.3/2.html,转载请声明来源钻瓜专利网。