[发明专利]一种基于连续特征的预测方法、系统和装置在审
| 申请号: | 202011004961.1 | 申请日: | 2020-09-22 |
| 公开(公告)号: | CN112036665A | 公开(公告)日: | 2020-12-04 |
| 发明(设计)人: | 孟格思;潘佳锋;薛淼;李敏 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F16/28;G06K9/62;G06N20/00 |
| 代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
| 地址: | 100193 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 连续 特征 预测 方法 系统 装置 | ||
本说明书提供一种基于连续特征的预测方法,所述方法包括将实体的至少一个连续特征通过对应的二叉树模型映射为至少一个第一独热编码,然后预测模型基于至少一个第一独热编码获取实体的预测结果。其中,每一个连续特征对应一个二叉树模型,使得基于连续特征映射得到的第一独热编码可以包含更多的信息量,从而提高预测模型的准确性。
技术领域
本申请涉及机器学习领域,特别涉及一种基于连续特征的预测方法、系统和装置。
背景技术
在机器学习领域,预测模型可以根据实体的特征实体的特征对实体进行预测(例如,对用户是否喜欢商品进行预测)。实体的特征实体的特征包括连续特征和离散特征。未经处理的连续特征或者将连续特征简单离散后得到的独热编码,均不能有效利用连续特征的信息。
因此,有必要提供一种能够有效利用连续特征信息的预测方法、系统和装置。
发明内容
本说明书的一个方面提供一种基于连续特征的预测方法,所述方法包括:获取实体的特征实体的特征,所述实体的特征包括至少一个连续特征和至少一个离散特征;针对每一个所述连续特征,将所述连续特征通过对应的二叉树模型映射为第一独热编码,所述第一独热编码对应所述二叉树模型的一个叶子节点;针对每一个所述离散特征,离散模型将所述离散特征映射为第二独热编码;预测模型基于至少一个所述第一独热编码和至少一个所述第二独热编码,获取表示向量,并基于所述表示向量获取所述实体的预测结果。
本说明书的另一个方面提供一种基于连续特征的预测系统,所述系统包括:获取模块,用于获取实体的特征,所述实体的特征包括至少一个连续特征和至少一个离散特征;第一编码模块,用于针对每一个所述连续特征,将所述连续特征通过对应的二叉树模型映射为第一独热编码,所述第一独热编码对应所述二叉树模型的一个叶子节点;第二编码模块,用于针对每一个所述离散特征,离散模型将所述离散特征映射为第二独热编码;预测模块,用于预测模型基于至少一个所述第一独热编码和至少一个所述第二独热编码,获取表示向量,并基于所述表示向量获取所述实体的预测结果。
本说明书的另一个方面提供一种基于连续特征的预测装置,包括处理器,所述处理器用于执行所述基于连续特征的预测方法。
附图说明
本说明书将以示例性实施例的方式进一步描述,这些示例性实施例将通过附图进行详细描述。这些实施例并非限制性的,在这些实施例中,相同的编号表示相同的结构,其中:
图1是根据本说明书的一些实施例所示的基于连续特征的预测系统的应用场景示意图;
图2是根据本说明书的一些实施例所示的基于连续特征的预测方法的示例性流程图;
图3是根据本说明书的一些实施例所示的二叉树模型的示意图;
图4是根据本说明书的一些实施例所示的推荐模型的示意图;
图5是根据本说明书的一些实施例所示的联合训练二叉树模型和预测模型的示例性流程图;
图6是根据本说明书的一些实施例所示的确定初始二叉树模型内部节点的判断条件的流程图;
图7是根据本说明书的一些实施例所示的获取初始二叉树模型参数的示意图。
具体实施方式
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单的介绍。显而易见地,下面描述中的附图仅仅是本说明书的一些示例或实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图将本说明书应用于其它类似情景。除非从语言环境中显而易见或另做说明,图中相同标号代表相同结构或操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011004961.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种牛角轮自动装配机
- 下一篇:一种乳腺术后马甲式可加压止血工具及其使用方法
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





