[发明专利]一种基于微博的新闻事件影响力预测方法有效
申请号: | 201810839521.4 | 申请日: | 2018-07-27 |
公开(公告)号: | CN108876058B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 黄圣君;唐英鹏 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 新闻 事件 影响力 预测 方法 | ||
本发明公开一种基于微博的新闻事件影响力预测方法,首先,获取足量新闻事件微博数据提取特征并计算影响力以训练预测模型f(x);其次,当预测模型训练好后,根据输入的新事件关键词p与事件发生日期获取早期微博讨论数据Tp;然后,从获得早期数据Tp中提取特征xp;最后,将新样本的特征向量xp输入训练好的模型中得到其未来影响力的预测值f(xp)。采用本发明对新闻事件影响力的计算更加合理、全面,能够提升对网络内容的预测精度,预测效果更好。
技术领域
本发明属于机器学习技术领域,具体涉及一种基于微博的新闻事件影响力预测方法。
背景技术
新闻事件反映了社会的方方面面,从人民群众的心愿,呼声到国家政策方针,发展规划,乃至世界上的重大事件都由新闻来传播。新闻作为一个权威,客观的消息传播媒体,其传播的信息对社会有重大影响力,对国家来说,新闻具有舆论引导,维护社会安定的作用,对构建和谐社会起了关键作用。预测新闻事件的影响力是一个重要的任务,能在事件发生早期就发现该事件最终的影响力,就可尽早判断舆情发展走向,引导舆论,以便适时作出应对策略上的调整。同时该发明不仅能与新闻内容结合提供更可信的决策支持,且对于政府的舆情监控、企业的危机公关、投资机构的投资决策都有重要的意义。
评价一个新闻事件的影响力是困难的,需要多位资深专家才能给出较为客观地评价,社交网络上的数据尽管粗糙,但随着社交网络的普及,用户对新闻事件的讨论情况能够较好地量化为计算影响力的指标,本发明拟从社交网络数据中挖掘出新闻事件的影响力,社交网络中大量的新闻数据也为研究新闻影响力预测提供了很好的数据源。使用传统的流行度度量方法来代表影响力是不全面的,有些事件因为其本身更有趣,所以会更热门,但是真正具有影响力的事件不止于此,新闻事件本身不同于娱乐报道,由于新闻实事求是,客观公正,这使得其讨论通常低于娱乐性的新闻,若只考虑流行度作为新闻的影响力显然是不全面的,应该考虑多方面的因素来计算影响力的分值。其次,由于社交网络的复杂性,传统的基于早期流行度的预测方法可能并不适用于社交网络的背景,信息在社交网络上的传播与其他环境下大不相同。
发明内容
发明目的:本发明提供一种计算更加合理、全面,能够提升对网络内容的预测精度,预测效果更好的基于微博的新闻事件影响力预测方法。
技术方案:本发明所述的一种基于微博的新闻事件影响力预测方法,包括以下步骤:
(1)获取足量新闻事件微博数据提取特征并计算影响力以训练预测模型 f(x);
(2)预测模型训练好后,根据输入的新事件关键词p与事件发生日期获取早期微博讨论数据Tp;
(3)从获得早期数据Tp中提取特征xp;
(4)将新样本的特征向量xp输入训练好的模型中得到其未来影响力的预测值f(xp)。
步骤(1)所述的数据主要包括每个过去事件k自发生起N天的热门微博Hk与自事件发生日期起,前E天的早期微博Tk。
所述步骤(1)包括以下步骤:
(11)利用事件的热门微博Hk来计算影响力Ik:
其中,Hk是与事件k相关的,自事件发生起N天内的所有热门微博的集合,对于其中的每一条微博m,α1,α2,α3分别是转发数rm,评论数cm,点赞数lm的系数,h(·)是关于发布者与热门转发用户的粉丝数fm的函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810839521.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理