[发明专利]一种基于多面排序网络解决推文预测转发任务的方法有效
| 申请号: | 201810517197.4 | 申请日: | 2018-05-25 |
| 公开(公告)号: | CN108717587B | 公开(公告)日: | 2022-03-15 |
| 发明(设计)人: | 俞新荣 | 申请(专利权)人: | 杭州一知智能科技有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G06N3/04;G06N3/08 |
| 代理公司: | 无锡市汇诚永信专利代理事务所(普通合伙) 32260 | 代理人: | 张欢勇 |
| 地址: | 310052 浙江省杭州市萧山区萧山*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多面 排序 网络 解决 预测 转发 任务 方法 | ||
1.一种基于多面排序网络解决推文预测转发任务的方法,其特征在于包括如下步骤:
1)针对于一组社交网络用户及其对于的推文转发情况,构建包含用户、推文之间相互关系的社交媒体网络;
2)对于步骤1)所得到的社交媒体网络的带有图片的推文,利用卷积神经网络获取推文图片的表达,利用单词映射网络及LSTM网络获取推文文本的语义表达,利用随机初始化获取用户的映射表达;之后结合推文的图片及文本表达获取推文的综合表达,利用推文的综合表达及用户的表达获取反映用户本身对于推文感兴趣程度大小的值;
利用步骤1)构建的社交媒体网络中的用户之间相互关注的关系及用户表达矩阵,得到用户相互影响力分数,并利用该分数与用户表达及推文综合表达得到反映结合了用户之间相互影响的用户对于推文感兴趣程度的值;两者结合得到最终的损失函数;
3)利用所获得的含有用户推文转发关系及用户间关系的数据集,针对步骤2)所得的损失函数,经过训练,得到最终的损失函数,根据该函数可以对于任意用户及其关注的用户发出的任意推文进行排序,将更可能被用户转发的推文排在前列,所述的步骤2)其具体步骤为:
2.1)对于所给出的推文,利用如下方法获取带有图片的推文的综合表达:对于推文中的图片,输入到卷积神经网络中获取对应图片的表达,对于图片ii,输入到卷积神经网络中获取其对应表达xi;对于给定的微博博文,将其单词通过预先训练好的单词映射网络获取其单词映射,对于由一个单词序列构成的微博博文di,设其第t个单词通过预先训练好的单词映射网络获取的单词映射为xit,则将序列(xi1,xi2,...,xik)作为微博博文xi的单词映射表达,之后,将博文di分成若干段,并将各段的单词映射序列作为LSTM网络的输入,以LSTM网络的最后一个隐藏层的输出作为该段博文的映射表达,之后将各段的输出同时输入一个最大池化层,将池化层的输出yi作为微博博文di的映射表达;
2.2)利用多模态混合函数来得到推文的图片与文本的混合表达,给定第i条推文的图片表达映射xi与推文中的文本表达yi,则该推文的综合表达如下:
zi=g(W(i)xi+W(d)yi)
其中,W(i)与W(d)为该混合函数用来混合推文的图片表达与文本表达的权重矩阵,g(.)为非线性的双曲正切激活函数;
2.3)通过随机初始化得到用户的映射矩阵U={u1,u2,...,ul},其中up代表了用户p的映射向量,利用如下公式获取用户p本身对于推文i的感兴趣程度大小值:
2.4)利用如下公式获取用户p受到其所关注的用户q的影响力大小:
spq=p·tanh(W(s)up+W(n)uq+b)
其中,up代表了用户p的映射向量,uq代表了用户p所关注的用户q的映射向量,W(s)与W(n)为用来反映用户q对于用户p影响力大小的权重矩阵,b为偏置向量,tanh(.)为非线性的双曲正切激活函数, p为用来计算影响力分数大小的参数向量;
针对于用户p会关注多个用户,则针对于用户p关注的用户集合Np中的每一个用户q,用户q对于用户p的相对影响力分数大小为;
2.5)利用步骤2.4)获取的用户p对于用户q的影响力权重α,与步骤2.3)所得到的用户p本身对于推文i的感兴趣程度大小,得到用户p在其所关注的所有用户的影响下,对于推文i感兴趣程度的大小值为:
则结合步骤4所得到的用户p本身对于推文i的感兴趣程度大小可以得到用户p对于推文i转发的概率大小为:
2.6)给定包含用户之间相互关注关系与用户推文的数据集合(j,i,k,Nj),该集合表示用户j对于推文i的转发概率高于对于推文k的转发概率,且用户i所关注的用户集合为Nj,同时给定所得的针对于数据集合(j,i,k,Nj)中的所有用户j的转发概况函数则可以构建最终的带注意力机制的多模态排序损失函数:
其中,为用户j对于未转发的推文k的转发概率值,为用户j对于转发的推文i的转发概率值,c代表损失函数中的间隔值;
2.7)结合模型中所有参数作为损失项,可得到最终的损失函数如下:
其中,Ψ为模型中的所有参数构成的集合,β为对于步骤7所得的带注意力机制的多模态排序损失函数损失项与模型参数值损失项的权衡参数,(j,i,k,Nj)为模型对应的所有代表用户j对于推文i的转发概率高于对于推文k的转发概率的数据集合。
2.根据权利要求1所述基于多面排序网络解决推文预测转发任务的方法,其特征在于所述的步骤3)具体为:
对于步骤2)中的最终的目标函数,本发明使用随机梯度下降的方法来更新参数,并且使用Adagrad的学习率更新方法进行网络中的所有参数的更新,获取最终的任意用户j的推文转发概率预测函数Fuj(.);利用所形成的推文转发概率预测函数对于某一用户所关注的用户转发的推文,求得该用户对于所关注用户转发推文的转发概率大小,将具有最大转发概率的推文作为该用户最可能转发的推文。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州一知智能科技有限公司,未经杭州一知智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810517197.4/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





