[发明专利]一种基于媒介贡献度的新闻热点预测方法在审
| 申请号: | 202110843006.5 | 申请日: | 2021-07-26 |
| 公开(公告)号: | CN113535956A | 公开(公告)日: | 2021-10-22 |
| 发明(设计)人: | 向安玲 | 申请(专利权)人: | 北京清博智能科技有限公司 |
| 主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q10/04;G06K9/62 |
| 代理公司: | 北京世誉鑫诚专利代理有限公司 11368 | 代理人: | 郭官厚 |
| 地址: | 100088 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 媒介 贡献 新闻 热点 预测 方法 | ||
本发明公开了一种基于媒介贡献度的新闻热点预测方法,包括:步骤一:利用新闻热点标签的生成方法及系统提取新闻数据集中的新闻簇;步骤二:利用智能信息处理技术来采集出这些热点舆情事件的相关数据;步骤三:利用贡献值计算的模型对不同领域热点事件中。本发明克服了现有人工方法效率低下,准确度严重依赖知识经验的弊端,通过大数据及语义分析技术,使用计算机算法实现,大大提升速度、效率及其适用场景,通过大数据技术,采集和分析海量数据,极大扩大了分析的样本数据及案例,充分利用历史积累的大量案例,对于用户内容倾向和舆论热点传播的各方面特征进行挖掘,模型更为科学合理,分析结果不断得到改善,并达到一定准确度。
技术领域
本发明属于信息传播、计算机基数、大数据挖掘算法技术领域,具体为一 种基于媒介贡献度的新闻热点预测方法。
背景技术
在观察新信息分析和发布的时候,人们通常不清楚要发布的内容是否会引 起读者的关注,是否会点燃读者较高的传播热情。例如:在新闻门户、社交媒 体平台上,什么主题的新闻更容易成为传播的热点;在不同的平台、不同类型 的账号里,哪些平台发的新闻更容易成为当前的舆论热点;对于特定人物,有 关该人物哪些事项的主题会更容易成为新闻焦点。对于这类信息的预测通常依 赖于人的知识与经验,现提出通过计算机技术进行大数据的计算,帮助预测新 生的新闻事件中,哪些事件会变成人们关注、讨论和传播的舆论热点。
针对上述需求,现有的预测方法通常预测方法为人工的预测方案,其过程 和结果严重依赖用户的知识与经验,准确性及可重复性存在不稳定状态。因此 本发明提出一种基于媒介贡献度的新闻热点预测方法,通过新生事件参与信源 的贡献度数值,提早研判其是否可成为热点事件,以便做出针对性的议程设置 和准备应对措施。
发明内容
本发明的目的在于解决背景技术中的问题,提供一种基于媒介贡献度的新 闻热点预测方法。
本发明采用的技术方案如下:
一种基于媒介贡献度的新闻热点预测方法,包括以下步骤:
步骤一:利用新闻热点标签的生成方法及系统提取新闻数据集中的新闻 簇;
步骤二:利用智能信息处理技术来采集出这些热点舆情事件的相关数据;
步骤三:利用贡献值计算的模型对不同领域热点事件中,不同平台、不同 类型账号、不同时期的贡献度进行计算;
步骤四:得到分平台、分信源、分时期的热点事件媒介贡献度指数。
优选的,所述步骤一包括:
第一提取单元,用于提取新闻数据集中的新闻簇,一个所述新闻簇包括至 少两个所述新闻记录;
确定单元,用于确定提取出的多个所述新闻簇中的热点新闻簇;
第二提取单元,用于提取所述热点新闻簇中各新闻记录的关键字;
第一生成单元,用于生成由一个新闻记录的至少两个所述关键字组合的组 合词,一个新闻记录对应一个或多个所述组合词;
第二生成单元,用于根据所述组合词的热度值生成新闻热点标签。
优选的,所述第一提取单元包括:
第一计算模块,用于计算所述新闻数据集中两个新闻记录之间的相似度; 判断模块,用于判断所述相似度是否大于第一预设阈值;以及
第一确定模块,用于所述相似度大于所述第一预设阈值时,确定所述两个 新闻记录属于同一新闻簇。
优选的,所述第一计算模块包括:
特征化子模块,用于将所述两个新闻记录分别进行特征化提取,得到一个 新闻记录对应的第一向量和另一个新闻记录对应的第二向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京清博智能科技有限公司,未经北京清博智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110843006.5/2.html,转载请声明来源钻瓜专利网。





