[发明专利]一种获取目标对象的热点内容的方法和装置在审
申请号: | 202111254646.9 | 申请日: | 2021-10-27 |
公开(公告)号: | CN113987370A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 李凯;周晗 | 申请(专利权)人: | 北京金堤科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/35;G06F16/38;G06F16/338 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 刘爱丽 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 目标 对象 热点 内容 方法 装置 | ||
本发明实施例公开了一种获取目标对象的热点内容的方法和装置,以及存储介质和电子设备,其方法包括:获取目标对象在预设时间段内的舆情内容,其中,所述舆情内容包括多条舆情信息;确定每条舆情信息的训练数据文本;确定每条舆情信息的内容热值;根据所述预设时间段内的每条舆情信息的训练数据文本,确定每条舆情信息的文本表示向量;对所述预设时间段内的多条舆情信息的文本表示向量进行内容聚类,以获得多个聚类簇;根据每个聚类簇中包括的每条舆情信息的内容热值确定目标对象在所述预设时间段内的热点内容。本发明实施例所述方法和装置能为用户及时高效地输出目标对象的热点内容,提高了用户决策的效率。
技术领域
本发明涉及数据挖掘技术领域,并且更具体地,涉及一种获取目标对象的热点内容的方法和装置,以及存储介质和电子设备。
背景技术
目前,每天都会有大量的舆情内容产生,不同的舆情内容关联的对象也不相同,而且网络用户对不同舆情内容的关注程度也不相同。对于海量舆情内容涉及的对象,有些用户根据需要关注的对象在一定时间内的舆情内容挖掘出舆情内容的数量,或者受关注程度有显著变化的对象作为目标对象后,会希望对目标对象在一定时间内的舆情内容进行挖掘,从而快速地发现有关目标对象的热点内容,为及时做出决策提供重要依据。但由于舆情内容的数量庞大以及内容繁杂,导致有决策需求的用户无法从众多的数据内容中及时高效地挖掘出目标对象的热点内容,因此无法满足用户后续针对目标对象的舆情内容快速挖掘出热点内容,从而辅助决策的需求。
发明内容
本发明要解决的问题为当从舆情内容中挖掘出目标对象后,如何针对目标对象在一段时间内的舆情内容,挖掘出其中的热点内容,从而为有决策需求的用户推送目标对象的热点内容,为其及时做出决策提供参考。然而,由于舆情内容的数量庞大和内容繁杂,目前尚缺乏有效地获取目标对象的热点内容的技术手段。
为了解决现有技术中对于有决策需求的用户无法从目标对象众多的舆情内容中及时高效地获取热点内容的技术问题,本发明的实施例提供一种获取目标对象的热点内容的方法和装置,以及存储介质和电子设备。
根据本发明实施例的一个方面,提供了一种获取目标对象的热点内容的方法,所述方法包括:
获取目标对象在预设时间段内的舆情内容,其中,所述舆情内容包括多条舆情信息;
确定每条舆情信息的训练数据文本;
确定每条舆情信息的内容热值;
根据所述预设时间段内的每条舆情信息的训练数据文本,确定每条舆情信息的文本表示向量;
对所述预设时间段内的多条舆情信息的文本表示向量进行内容聚类,以获得多个聚类簇;
根据每个聚类簇中包括的每条舆情信息的内容热值确定目标对象在所述预设时间段内的热点内容。
根据本发明实施例的另一个方面,本发明提供一种获取目标对象的热点内容的装置,所述装置包括:
数据获取单元,用于获取目标对象在预设时间段内的舆情内容,其中,所述舆情内容包括多条舆情信息;
第一处理单元,用于确定每条舆情信息的训练数据文本;
第二处理单元,用于确定每条舆情信息的内容热值;
第三处理单元,用于根据所述预设时间段内的每条舆情信息的训练数据文本,确定每条舆情信息的文本表示向量;
内容聚类单元,用于对所述预设时间段内的多条舆情信息的文本表示向量进行内容聚类,以获得多个聚类簇;
话题确定单元,用于根据每个聚类簇中包括的每条舆情信息的内容热值确定目标对象在所述预设时间段内的热点内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金堤科技有限公司,未经北京金堤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111254646.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种氯丁橡胶导流套及其制备方法
- 下一篇:一种确定目标对象的方法和装置