[发明专利]长尾级联流行度预测模型、训练方法及预测方法有效

专利信息
申请号: 202111169186.X 申请日: 2021-10-08
公开(公告)号: CN113887806B 公开(公告)日: 2023-04-07
发明(设计)人: 周帆;余柳;代雨柔;钟婷 申请(专利权)人: 电子科技大学
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q50/00;G06N20/00
代理公司: 成都虹盛汇泉专利代理有限公司 51268 代理人: 王伟
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 长尾 级联 流行 预测 模型 训练 方法
【说明书】:

发明公开了一种长尾级联流行度预测模型、训练方法及预测方法,该长尾级联流行度预测模型包括骨干网络、以及位于骨干网络之后的回归器,回归器包括并行设置的原始回归器和子网络SUB;骨干网络和原始回归器构成长尾级联流行度预测模型的基线模型;骨干网络用于提取长尾级联的时间特征和空间特征;原始回归器用于得到该长尾级联流行度的原始预测值;述子网络SUB用于得到该长尾级联流行度的加权偏差;以该长尾级联流行度的原始预测值与加权偏差之和作为最终流行度预测值。本发明利用解耦的思想,整个模型训练分为两个阶段,首先利用不同的采样策略来提取骨干网络的特征表示,然后将骨干网络的参数固定住,再通过几种不同的方法微调回归器,该回归器结合了原始的预测值和由子网络SUB产生的加权偏差值,达到更准确预测流行度的目的。

技术领域

本发明属于深度学习(Deep Learning)中的信息扩散(Information diffusion)、信息级联(Information Cascade)和流行度预测(Popularity Prediction)领域,是一种基于解耦思想(Decoupling Scheme)来解决长尾级联预测(Long-tailed CascadePrediction)问题的通用方法。

背景技术

信息扩散是指信息通过交互作用从一个地方传播到另一个地方的过程,该领域涵盖了来自众多科学领域的技术,包括社会学,流行病学和人种论等不同领域的技术。本发明是针对信息级联的扩散进行合理有效的建模和流行度预测。信息级联的一项典型任务是预测某一条级联(推文、微博等),在特定一段时间段后潜在受影响用户的规模,也即流行度预测。特别地,Twitter,Facebook,微信和新浪微博等在线社交平台的出现为信息的产生和传播带来了前所未有的便利。用户通过社交网络以级联的形式传播各种新闻,事件和帖子。因此,这一对信息级联流行度的准确预测任务对于这些平台的用户和所有者都很有价值。例如,了解哪种类型的推文传播更广泛,可以帮助营销专家设计他们的策略;预测谣言的潜在影响用户,使得管理员可以及早进行干预以避免严重后果等。

传统的方法将精力集中在对级联的传播进行转发关系和时间特征建模,传统的建模方法面临着数据集严重不平衡的挑战,为了防止损失函数或度量指标受到少部分极值数据的影响,传统的方法重新制定了问题定义,例如将问题转化为分类问题,预测一条级联是否会超过级联的中值大小;或者是采用其他的评估指标,如k-top覆盖率、确定/相关系数及其变量、排名。

然而,现实中的数据集存在极度不平衡的现象,服从长尾分布(Long-tailDistribution)。例如在级联预测问题中,大的级联占据少数,小的级联占大多数,该现象导致实例丰富的数据支配训练过程,从而导致模型的预测非常保守,使得预测值分布在相对中间大小的范围内,从而降低了预测性能。

但是,目前还没有研究从数据服从长尾分布的角度来解决级联预测效果低下的回归问题。

发明内容

本发明的目的旨在针对传统方法直接回避长尾数据带来的预测准确率不高、可解释性低等技术现状,提供一种直面长尾级联信息数据的流行度预测模型及训练方法,利用解耦思想,进行分步训练,以此来提高流行度预测准确率,能够作为现有的级联流行度预测模型的可拔插的通用方法,并具有较强的可解释性。

本发明的另一目的旨在提供一种长尾级联流行度预测方法。

本发明提供的长尾级联流行度预测模型可以使用传统的级联流行度预测模型(例如DeepCas、DeepHawkes、VaCas等)作为本发明长尾级联流行度预测模型的基线模型,所有基线模型都是采用联合训练的方式,本发明在基线模型基础之上采用解耦训练的思想。

本发明提供的长尾级联流行度预测模型包括骨干网络、以及位于骨干网络之后的回归器,所述回归器包括并行设置的原始回归器和设计的子网络SUB;所述骨干网络和原始回归器构成长尾级联流行度预测模型的基线模型;

所述骨干网络用于提取长尾级联的时间特征和空间特征;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111169186.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top