[发明专利]基于时间感知与关键信息抽取的用户转发预测方法和系统在审
申请号: | 202111305785.X | 申请日: | 2021-11-05 |
公开(公告)号: | CN114048395A | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 林政;付鹏;刘欢;张雨帆;王伟平;孟丹 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06Q50/00;G06F40/194;G06F40/30;G06N3/04;G06N3/08 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时间 感知 关键 信息 抽取 用户 转发 预测 方法 系统 | ||
本发明涉及一种基于时间感知与关键信息抽取的用户转发预测方法和系统。该方法的步骤包括:根据用户与目标推文的原作者的全部历史发布内容的相关性,以及用户与原作者发布内容所关注的主题随时间迁移的特性,得到融合用户及原作者的全局和层级历史内容后的目标推文特征表示;使用Topk‑Mask机制动态地抽取用户的朋友圈信息关键词,使用Tweet‑Mask机制学习用户的每条朋友圈推文的权重,并将两种机制输出的结果合并,得到用户的朋友圈特征表示;根据融合用户及原作者的全局和层级历史内容后的目标推文特征表示,以及用户的朋友圈特征表示,预测用户是否会对目标推文进行转发。本发明能够有效提高用户转发预测的准确率。
技术领域
本发明属于信息技术、社交媒体、自然语言处理技术领域,具体涉及一种基于时间感知与关键信息抽取的用户转发预测方法和系统。
背景技术
在用户行为预测中,转发预测任务近年来受到了广泛的关注。目前,社交媒体中转发预测的研究主要采用两种信息。第一种研究方法通过社交网络图结构来构建预测模型。如Zhao等人从注意力排序网络的角度研究了图像转发的问题。作者引入了具有两个子网的多模态神经网络,其中递归神经网络学习图像推文的上下文语义表示,卷积神经网络学习图片视觉表示,之后将其与用户历史信息计算注意力系数得到用户对各个图像的偏好排名以预测转发趋向。Cao等人通过研究网络中用户的级联效应来判断用户在未来某一时刻是否进行转发行为。该工作设定用户的转发行为取决于与其相关用户的转发状态与当前用户的影响力,通过以上两个因素来建模信息在用户网络中的传播过程,判断用户在最终时刻的转发状态。第二种方法以内容表示为研究路线,从用户上下文中提取用户偏好用以预测对特定内容的转发情况。Zhang等人提出了一种基于注意力的深度神经网络来整合上下文信息和社会信息,用特征嵌入方法来表示用户、用户的关注兴趣、作者和推文等信息。Ma等人在预测模型中将用户关注话题融入其中,通过主题模型提取用户与其相关用户及其参与讨论过的话题来获得用户关注偏好,再将目标内容与用户相关话题计算相似度来得到用户对应目标信息的向量表示用于预测转发行为。
现有的转发预测方法大多着眼于利用用户发布历史、用户社交关系等多种信息对用户偏好进行建模。从Ma等人的工作中本方案可以看到,用户的转发行为主要受到以下几个方面影响:1)用户本身是否对目标文本的主题内容感兴趣,如果该文本与用户历史内容主题相近则更有可能被转发;2)用户是否与目标文本原作者其它发表内容风格相似,如果两用户本身风格相似,则用户更容易转发该文本;3)用户朋友圈内近期是否出现相关主题,如果该文本所涉及话题高频曝光,则用户会更有倾向去关注该话题下内容。
基于以上的影响因素可以发现,目前的用户转发研究工作仍然存在几点待改善问题:1)以往的工作使用历史发布内容判断用户和原作者相似度。而事实上,用户与原作者发布的内容主题多样且关注点会随时间变化,以往工作忽视了用户历史内容随时间变化这一特点,而将用户时间线上所有历史发布内容统一对待。2)用户朋友圈内容可以作为辅助信息帮助判断用户是否会对目标内容的话题感兴趣,但用户朋友圈内容通常多样复杂,关键的话题词往往只有简短几个。以往的工作并没有一个能够从众多朋友圈内容中筛选出与目标文本真正相关信息的机制。
发明内容
本发明针对上述问题,提供一种基于时间感知与关键信息抽取的用户转发预测方法和系统。
本发明采用的技术方案如下:
一种基于时间感知与关键信息抽取的用户转发预测方法,包括以下步骤:
根据用户与目标推文的原作者的全部历史发布内容的相关性,以及用户与原作者发布内容所关注的主题随时间迁移的特性,得到融合用户及原作者的全局和层级历史内容后的目标推文特征表示;
使用Topk-Mask机制动态地抽取用户的朋友圈信息关键词,使用Tweet-Mask机制学习用户的每条朋友圈推文的权重,并将两种机制输出的结果合并,得到用户的朋友圈特征表示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111305785.X/2.html,转载请声明来源钻瓜专利网。