[发明专利]一种获取目标对象的热点内容的方法和装置在审
| 申请号: | 202111254646.9 | 申请日: | 2021-10-27 |
| 公开(公告)号: | CN113987370A | 公开(公告)日: | 2022-01-28 |
| 发明(设计)人: | 李凯;周晗 | 申请(专利权)人: | 北京金堤科技有限公司 |
| 主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/35;G06F16/38;G06F16/338 |
| 代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 刘爱丽 |
| 地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 获取 目标 对象 热点 内容 方法 装置 | ||
1.一种获取目标对象的热点内容的方法,其特征在于,所述方法包括:
获取目标对象在预设时间段内的舆情内容,其中,所述舆情内容包括多条舆情信息;
确定每条舆情信息的训练数据文本;
确定每条舆情信息的内容热值;
根据所述预设时间段内的每条舆情信息的训练数据文本,确定每条舆情信息的文本表示向量;
对所述预设时间段内的多条舆情信息的文本表示向量进行内容聚类,以获得多个聚类簇;
根据每个聚类簇中包括的每条舆情信息的内容热值确定目标对象在所述预设时间段内的热点内容。
2.根据权利要求1所述的方法,其特征在于,其中确定每条舆情信息的训练数据文本包括:
确定每条舆情信息的标题和信息项,其中,所述信息项包括按照出现的先后顺序进行编号的C条语句,C为自然数,C≥3;
将每条舆情信息的标题和信息项中从编号1开始的c条语句进行合并,生成每条舆情信息的训练数据文本,3≤c≤C。
3.根据权利要求1所述的方法,其特征在于,其中确定每条舆情信息的内容热值包括:
确定每条舆情信息的信息项的数据来源和信息项的相似文章数量;
根据每条舆情信息的信息项的数据来源和相似文章数量计算每条舆情信息的内容热值。
4.根据权利要求3所述的方法,其特征在于,根据每条舆情信息的信息项的数据来源和相似文章数量计算每条舆情信息的内容热值包括:
按照预先设置的数据来源权重值表确定每条舆情信息的信息项的数据来源的权重值;
根据每条舆情信息的信息项的数据来源的权重值和相似文章数量计算每条舆情信息的内容热值,其计算公式为:
R=P*W
式中,R是内容热值,P是舆情信息的信息项的数据来源的权重值,W是舆情信息的信息项的相似文章数量。
5.根据权利要求1所述的方法,其特征在于,根据所述预设时间段内的每条舆情信息的训练数据文本,确定每条舆情信息的文本表示向量包括:
将预设时间段内的全部舆情信息的训练数据文本输入预先确定的训练模型中,生成每条舆情信息的文本向量;
将每条舆情信息的文本向量按照均值变换为0,协方差矩阵变换为单位矩阵的方式进行线性变换,生成每条舆情信息的文本表示向量。
6.根据权利要求1所述的方法,其特征在于,根据每个聚类簇中包括的舆情信息的内容热值确定目标对象在所述预设时间段内的热点内容包括:
对每个聚类簇中包括的每条舆情信息的内容热值求和,确定每个聚类簇的簇热值;
输出簇热值最大的聚类簇中的舆情信息作为目标对象在所述预设时间段的热点内容。
7.根据权利要求1所述的方法,其特征在于,获取目标对象在预设时间段内的舆情内容之前还包括:
获取预设时间段内的舆情内容,并根据预设时间段生成至少两个滑动时间窗口;其中,所述舆情内容包括信息项;
按照多个对象对每个滑动时间窗口中的信息项进行统计,以获得每个对象在每个滑动时间窗口中的信息项的数量;
根据每个对象在每个滑动时间窗口中的信息项的数量从多个对象中确定目标对象。
8.根据权利要求1所述的方法,其特征在于,获取目标对象在预设时间段内的舆情内容之前还包括:
获取当前舆情内容;
确定与所述当前舆情内容相关联的当前对象;
获取预设时间段内与所述当前对象相关联的舆情内容;其中,与所述当前对象相关联的舆情内容包括所述当前对象的信息项;
基于所述预设时间段内的舆情内容确定所述当前对象的待检测序列;
确定所述待检测序列与预先生成的模板序列的匹配值,根据所述匹配值确定所述当前对象是否为目标对象。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金堤科技有限公司,未经北京金堤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111254646.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种氯丁橡胶导流套及其制备方法
- 下一篇:一种确定目标对象的方法和装置





