[发明专利]一种房产评估数据生成方法和装置在审
申请号: | 201710148148.3 | 申请日: | 2017-03-13 |
公开(公告)号: | CN108572988A | 公开(公告)日: | 2018-09-25 |
发明(设计)人: | 张亚楠;叶舟;王瑜;杨洋;苏飞 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G06Q50/16 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 赵娟 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 地理区域 评估数据 随机森林 用户数据 电子商务平台 方法和装置 目标特征 影响因子 原始特征 决策树模型 价值评估 网页数据 申请 买方 参考 互联网 评估 支撑 | ||
1.一种房产评估数据生成方法,其特征在于,包括:
获取地理区域内的用户数据和地理区域影响因子;
从所述地理区域内的用户数据和地理区域影响因子中提取原始特征数据;
从所述原始特征数据中选取目标特征数据;
采用所述目标特征数据,生成随机森林模型;
根据所述随机森林模型,生成所述地理区域的房产评估数据。
2.根据权利要求1所述的方法,其特征在于,所述从所述原始特征数据中选取目标特征数据的步骤包括:
对所述原始特征数据进行预处理;
针对经过预处理的原始特征数据计算重要度参数;
根据所述重要度参数选取目标特征数据。
3.根据权利要求1所述的方法,其特征在于,所述随机森林模型包括多个决策树模型,所述根据所述随机森林模型,生成所述地理区域的房产评估数据的步骤包括:
确定所述随机森林模型的决策树模型中的各个节点路径;
根据所述各个节点路径,生成所述地理区域的房产评估数据。
4.根据权利要求1所述的方法,其特征在于,所述随机森林模型包括多个决策树模型,所述根据所述随机森林模型,生成所述地理区域的房产评估数据的步骤包括:
统计所述随机森林模型的决策树模型的各类叶子节点的数目;
计算同一类叶子节点的数目,与同一决策树模型中所有叶子节点的数目的比值;
根据所述比值,生成所述地理区域的房产评估数据。
5.根据权利要求1所述的方法,其特征在于,所述从所述地理区域内的用户数据和地理区域影响因子中提取原始特征数据的步骤包括:
对所述地理区域内的用户数据和地理区域影响因子进行数据清洗;
针对清洗后的数据提取原始特征数据。
6.根据权利要求5所述的方法,其特征在于,所述对所述地理区域内的用户数据和地理区域影响因子进行数据清洗的步骤包括:
检测所述地理区域内的用户数据和地理区域影响因子是否存在异常数据;
若存在异常数据,则根据异常数据的取值,对所述异常数据进行调整或舍弃所述异常数据。
7.根据权利要求6所述的方法,其特征在于,所述对所述地理区域内的用户数据和地理区域影响因子进行数据清洗的步骤还包括:
检测所述地理区域内的用户数据和地理区域影响因子是否存在缺失数据;
若存在缺失数据,则对所述缺失数据进行估算处理;
根据估算处理结果对所述缺失数据进行补全,或对所述缺失数据进行舍去处理。
8.根据权利要求5所述的方法,其特征在于,所述原始特征数据包括类别型特征数据,所述针对清洗后的数据提取原始特征数据的步骤包括:
从所述清洗后的数据中选取描述性数据;
从所述描述性数据中抽取类别型特征数据。
9.根据权利要求8所述的方法,其特征在于,所述原始特征数据还包括词袋模型特征数据,所述针对清洗后的数据提取原始特征数据的步骤还包括:
从所述描述性数据中抽取词袋模型特征数据。
10.根据权利要求9所述的方法,其特征在于,所述原始特征数据还包括数值型特征数据,所述针对清洗后的数据提取原始特征数据的步骤还包括:
从所述清洗后的数据中选取数值型数据;
从数值型数据中抽取数值型特征数据。
11.根据权利要求10所述的方法,其特征在于,所述针对清洗后的数据提取原始特征数据的步骤还包括:
对所述数值型特征数据进行归一化处理。
12.根据权利要求2所述的方法,其特征在于,所述对所述原始特征数据进行预处理的步骤包括:
检测所述原始特征数据是否存在缺失特征数据;
若存在,则对所述缺失特征数据进行补全或舍去所述缺失特征数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710148148.3/1.html,转载请声明来源钻瓜专利网。