[发明专利]基于时间感知与关键信息抽取的用户转发预测方法和系统在审
| 申请号: | 202111305785.X | 申请日: | 2021-11-05 |
| 公开(公告)号: | CN114048395A | 公开(公告)日: | 2022-02-15 |
| 发明(设计)人: | 林政;付鹏;刘欢;张雨帆;王伟平;孟丹 | 申请(专利权)人: | 中国科学院信息工程研究所 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00;G06F40/194;G06F40/30;G06N3/04;G06N3/08 |
| 代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
| 地址: | 100093 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 时间 感知 关键 信息 抽取 用户 转发 预测 方法 系统 | ||
1.一种基于时间感知与关键信息抽取的用户转发预测方法,其特征在于,包括以下步骤:
根据用户与目标推文的原作者的全部历史发布内容的相关性,以及用户与原作者发布内容所关注的主题随时间迁移的特性,得到融合用户及原作者的全局和层级历史内容后的目标推文特征表示;
使用Topk-Mask机制动态地抽取用户的朋友圈信息关键词,使用Tweet-Mask机制学习用户的每条朋友圈推文的权重,并将两种机制输出的结果合并,得到用户的朋友圈特征表示;
根据融合用户及原作者的全局和层级历史内容后的目标推文特征表示,以及用户的朋友圈特征表示,预测用户是否会对目标推文进行转发。
2.根据权利要求1所述的方法,其特征在于,所述根据用户与原作者的全部历史发布内容的相关性,以及用户与原作者发布内容所关注的主题随时间迁移的特性,得到融合用户及原作者的全局和层级历史内容后的目标推文特征表示,包括:
根据用户和原作者的全部历史发布内容,得到用户和原作者的全局特征表示;
将用户和原作者的全部历史发布内容划分为K个片段,计算时间感知操作之后的用户和原作者的层级特征表示;
将目标推文分别与用户与原作者的全局特征表示、层级特征表示做注意力操作,得到用户与目标推文交互后的全局特征表示g1和层级特征表示h1,以及原作者与目标推文交互后的全局特征表示g2和层级特征表示h2;
将得到的推文交互表示与目标推文target拼接:
target(u,a)=concat[h1;g1;h2;g2;target]
其中,target(u,a)表示融合了用户u及原作者a的全局和层级历史内容后的目标推文特征表示。
3.根据权利要求2所述的方法,其特征在于,所述全局特征表示g1采用下式计算:
其中,Wu1表示针对用户全局特征的前馈神经网络参数,ui表示用户全局特征,Wt表示针对目标推文的前馈神经网络参数,target表示目标推文,表示注意力权重,T表示用户的历史推文数量,F表示前馈神经网络,||表示将用户与推文的特征进行维度变换然后拼接在一起,最后加权得到目标推文与用户的全局融合特征g1。
4.根据权利要求2所述的方法,其特征在于,所述层级特征表示h1采用下式计算:
其中,Wu2表示针对用户的层级特征的前馈神经网络参数,u′i表示用户的层级特征,Wh表示针对目标推文的前馈神经网络参数,target表示目标推文,表示注意力权重,K表示历史内容划分的片段数;使用用户每个时间片的特征与目标推文求权重系数,之后加权聚合得到目标推文与用户的层级特征的融合表示h1。
5.根据权利要求1所述的方法,其特征在于,所述Topk-Mask机制和所述Tweet-Mask机制为:
其中,Mtweet[i,j]表示Tweet-Mask机制的掩码矩阵;Mtopk[i,j]表示Topk-Mask机制的掩码矩阵;tweeti、tweetj表示第i和第j条推文;attn表示点乘注意力计算,f表示朋友圈内容表示向量,dim表示朋友圈内容表示向量的维数,tokeni表示第i个词。
6.根据权利要求5所述的方法,其特征在于,所述将两种机制输出的结果合并,得到用户的朋友圈特征表示,是将两个掩码机制与一个点乘注意力合并,得到朋友圈特征表示:
其中,attni表示点乘注意力计算;N表示朋友圈内容的数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111305785.X/1.html,转载请声明来源钻瓜专利网。





