[发明专利]基于深度森林的文本对象推荐方法有效

申请号：	201911231215.3	申请日：	2019-12-05
公开（公告）号：	CN111078834B	公开（公告）日：	2021-10-26
发明（设计）人：	杨波;吴施虎;余秦勇;王鹏	申请（专利权）人：	电子科技大学;中电科大数据研究院有限公司
主分类号：	G06F16/33	分类号：	G06F16/33;G06F16/35;G06F40/284;G06K9/62
代理公司：	电子科技大学专利中心 51203	代理人：	周刘英
地址：	611731 四川省成***	国省代码：	四川;51
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于深度森林文本对象推荐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于深度森林的文本对象推荐方法，属于推荐技术领域。本发明针对现有的基于深度学习的推荐方法的推荐方案的不足，通过将梯度提升与深度森林结合，提出一种结合了梯度提升和深度森林的推荐模型，并将其用于推荐文本对象。即本发明将用户和文本对象的特征信息输入到所设置的推荐模型中，则会输出一个0‑1的值，其代表了预测该用户会与该文本对象发生交互的可能性，即用户与文本对象的交互概率预测值。对每个用户，为其将未接触过的文本对象进行以交互概率预测值从大到小的排序，其中排名前K的文本对象将作为推荐列表推荐给该用户。

技术领域

本发明属于推荐技术领域，具体涉及一种基于深度森林的文本对象推荐方法。

背景技术

在现有的推荐方法当中，基于协同过滤的推荐模型一直是推荐技术领域的研究热点之一，而矩阵分解则一直是协同过滤推荐方法之中的一种经典的推荐模型，在推荐精度上也一直有很好的表现。

矩阵分解的思路，是从用户对物品的评分矩阵之中，学习到两个规模较小的矩阵，这两个矩阵分别代表用户和物品。对每个用户而言，他们在用户矩阵之中都有一个向量对其建模，物品在物品矩阵之中也是一样。用户向量和物品向量都可以在一定程度上被解释为一些语义，比如用户向量上某个对应位置的值代表其对某些因素的喜爱程度，而物品向量在该位置上的值就可以代表其与该因素的匹配程度，则该因素上两者的乘积就可以代表用户和物品在该因素上对最后评分的影响。

矩阵分解在处理物品和用户的信息交互的时候，采取的措施是对物品隐向量和用户隐向量进行内积操作。内积是一种较为简单的线性交互，而且没能考虑到不同的隐因子之间的交互，只有用户和物品的相同的隐因子之间的乘积作为交互。因而出现了基于深度学习的推荐方法，如在NCF(Neural Collaborative Filtering)方法中，其将深度学习的整体框架带到协同过滤当中，并且实现了较好的性能。在NCF中，采用神经网络来代替内积对用户和物品之间的交互进行建模，用用户和物品的one-hot编码向量作为输入，嵌入向量经过一个专门为推荐问题设置的神经网络得到预测值，通过反向传播进行优化。虽然，NCF中也用到了矩阵分解，用一定长度的向量来代表用户和物品的特征。与矩阵分解不同的是，NCF不是用内积，而是利用多层感知机这一典型的深度学习结构，对用户特征和物品特征之间的深层关系进行建模，可以学习到更复杂的用户和物品之间的关系，也取得了更好的推荐效果。

虽然基于深度学习的推荐方法是推荐精度最高的。但是深度学习技术本身存在着需要大量参数来进行训练、超参数过多等缺点，从而会导致基于深度神经网络的推荐方法也会出现类似的问题。

深度森林是近年来提出的一种新的深度模型，不同于以往的深度学习以人工神经网络作为基础结构，深度森林以决策树作为基本组成部分。深度森林相比深度神经网络有着训练时间较短、能适应不同规模数据、超参数较少且稳定的特点。梯度提升是集成学习中的一种思路，可以按照一定的策略训练出一些弱学习器并最后获得一个强学习器。

因此，有必要设置一种结合梯度提升和深度森立的推荐技术，从而解决基于深度学习的推荐技术导致的训练过程复杂且超参数过多的问题。

发明内容

本发明的发明目的在于：针对上述存在的问题，提供一种采用梯度提升深度森林进行文本对象推荐的方案，从而在保证与基于深度学习的推荐方案相当的推荐精度的同时，有效降低训练过程的复杂度，以及减少超参数数量。

步骤1：对文本对象进行预处理：

从用户与文本交互的平台的后台数据库中提取所有文本对象；

去除文本对象中的停用词，并统计在所有文本对象当中出现次数最多的D个词；其中D为预设值；

并基于所述D个词构造词典，基于所构造的词典为每个文本对象构建TF-IDF向量，作为文本对象的特征向量；

步骤2：构建用户和文本对象的交互矩阵Y：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于电子科技大学;中电科大数据研究院有限公司，未经电子科技大学;中电科大数据研究院有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911231215.3/2.html，转载请声明来源钻瓜专利网。