[发明专利]基于BP神经网络评分预测误差的近邻用户选择方法有效

申请号：	201810842917.4	申请日：	2018-07-27
公开（公告）号：	CN109345274B	公开（公告）日：	2022-05-24
发明（设计）人：	王一歌;温锦雄;韦岗	申请（专利权）人：	华南理工大学
主分类号：	G06Q30/02	分类号：	G06Q30/02;G06K9/62;G06N3/08
代理公司：	广州粤高专利商标代理有限公司 44102	代理人：	何淑珍;江裕强
地址：	510640 广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于 bp 神经网络评分预测误差近邻用户选择方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于BP神经网络评分预测误差的近邻用户选择方法，其特征在于，包括如下步骤：

S1将数据集按比例分为训练数据集和测试数据集，其中训练数据集用于作为已知信息用于评分预测模型的训练；

S2确定BP神经网络结构，确定各层神经元的个数；

所述BP神经网络结构具体为：BP神经网络结构分为输入层，隐含层以及输出层，数据从输入层的神经元输入，经过隐含层，最后由输出层输出，其中输入层的输入为物品的属性特征向量，假设物品i的属性特征向量为：

attr_i＝[a₁,...,a_s,...,a_k]

其中s取值为1～k，k为需要引入的物品属性特征个数，根据实际场景而定，当a_s为0的时候表示该物品不具有第s个属性特征，而当a_s等于1的时候表示该物品具有第s个属性特征；输入层神经元的个数与需要引入属性特征的个数一致，隐含层的个数为可调参数，可调参数通过实验决定，而输出层的神经元输出为预测评分，个数为1；假设输入层的神经元个数为k个，与考虑的物品属性特征个数一致；隐含层的神经元个数为p个，p为可调参数，由实验测试决定选择预测误差较少的p值；输出层的神经元个数为1；

S3确定BP神经网络各层神经元的激活函数；

S4为每个用户训练BP神经网络，具体为：假设第i个输入层神经元的输入为x_ii，输出为x_oi:

x_oi＝f_i(x_ii)

式中，f_i为输入层的神经元的激活函数；

第h个隐含层神经元的输入为h_ih，输出为h_oh，而第o个输出层的输入为y_io，输出为y₀：

h_oh＝f_h(h_ih)

y_o＝f_o(y_i)

式中，f_h为隐含层的神经元的激活函数，为f_o输出层的激活函数；

隐含层第h个神经元的输入为：

式中，W_ih为第i个输入层神经元与第h个隐含层神经元之间的连接权重，k为输入层的神经元个数；输出层神经元的输入为：

式中，W_ho为第h个隐含层神经元与输出层神经元之间的连接权重,p为隐含层的神经元个数；

假设当前用户为u，从训练数据集中找出属于用户u的历史评分记录集合Rat_u，每条评分记录至少包含用户ID，物品ID以及评分值，从历史评分记录集合Rat_u得到用户u的历史评分物品的集合I_u，其每个元素为物品的对应ID；初始化最大迭代次数为m，每次迭代的时候，从历史评分物品的集合I_u中按随机顺序取出物品ID，输入该物品ID对应的属性特征向量，假设当前输入的物品为i，其对应的属性特征向量为：

attr_i＝[a₁,a₂,...,a_k]

经过BP神经网络前向传播之后，输出层的神经元将输出当前用户u对该物品的预测评分y_o，使用用户对该物品的实际评分d与预测评分y_o对比进行误差计算得到：

BP神经网络在使用随机梯度下降法迭代更新网络参数的目标函数时，预测误差越小越好，每次迭代完成后，统计本次迭代过程的全局预测误差：

其中I_u为历史评分物品的集合，当E_u小于某个阈值或者达到最大迭代次数的时候，用户u的BP神经网络参数迭代更新完成；BP神经网络的迭代更新是在反向传播的过程，当计算完预测评分和实际评分的误差后，首先更新隐含层与输出层之间的连接权重参数，然后再更新输入层与隐含层之间的连接权重，利用随机梯度下降法可得：隐含层第h个神经元与输出层神经元之间的连接权重更新为：

其中α为梯度下降的步长，其中指全局误差E关于W_ho的梯度，即E关于W_ho减小最快的方向，f′_o(y_i)指输出层神经元激活函数y_o关于输出层神经元输入y_i的导数；输入层第i个神经元与隐含层第h个神经元之间的连接权重更新为其中α为梯度下降的步长，指全局误差E关于连接权重W_ih的梯度，即E关于连接权重W_ih减小最快的方向，其中f′_h(h_ih)指隐含层神经元激活函数y_h关于第h个隐含层神经元输入h_ih的导数；

S5为每个用户筛选近邻用户集合，具体为：假设当前用户u，为该用户筛选k个相似用户作为近邻用户集合，那么需要计算用户u与每个候选近邻用户的相似度，选择相似度最高的前k个候选近邻用户作为用户u的近邻用户集；假设候选近邻用户为v，那么使用候选近邻用户v训练好的BP神经网络模型对当前用户u的历史评分物品的集合I_u进行评分预测，假设历史评分物品的集合I_u的物品个数为n，候选用户v对历史评分物品的集合I_u中物品i的预测评分为bp_v,i，而当前用户u对该物品的实际评分为r_u,i，那么候选近邻用户v对当前用户u的历史评分记录的整体预测误差为当候选用户v对用户u的历史评分记录预测误差越小，表示候选用户v与用户u对物品属性特征都具有相似偏好，因此预测评分误差才会较小，则认为候选用户v与用户u越相似，相似度为因此按照该相似度计算模型能为用户u筛选出相似度最高的前k个近邻用户作为近邻用户集。

2.根据权利要求1所述的基于BP神经网络评分预测误差的近邻用户选择方法，其特征在于所述S3中的神经网络各层神经元的激活函数，具体为：输入层的神经元与输出层的神经元的激活函数选择线性函数f(x)＝ax+b，其中a和b的值根据具体场景决定即可，而隐含层神经元的激活函数采用sigmoid函数f(x)＝1/(1+e^-x)来完成用户评分与物品属性特征的非线性复杂关系。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于华南理工大学，未经华南理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810842917.4/1.html，转载请声明来源钻瓜专利网。

上一篇：一种出口企业融资信息化解决方法及系统
下一篇：用于超市购物车的导购方法及导购系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法；其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q30-00 商业，例如购物或电子商务
G06Q30-02 .行销，例如，市场研究与分析、调查、促销、广告、买方剖析研究、客户管理或奖励；价格评估或确定
G06Q30-04 .签单或开发票
G06Q30-06 .购买、出售或租赁交易
G06Q30-08 ..拍卖

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于BP神经网络评分预测误差的近邻用户选择方法有效

专利文献下载