[发明专利]一种确定目标对象的方法和装置在审
申请号: | 202111254647.3 | 申请日: | 2021-10-27 |
公开(公告)号: | CN113987371A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 李凯;周晗 | 申请(专利权)人: | 北京金堤科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/2458;G06F16/248 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 刘爱丽 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 目标 对象 方法 装置 | ||
1.一种确定目标对象的方法,其特征在于,所述方法包括:
获取预设时间段内的舆情内容,并根据预设时间段生成至少两个滑动时间窗口;其中,所述舆情内容包括信息项;
按照多个对象对每个滑动时间窗口中的信息项进行统计,以获得每个对象在每个滑动时间窗口中的信息项的数量;
根据每个对象在每个滑动时间窗口中的信息项的数量从多个对象中确定目标对象。
2.根据权利要求1所述的方法,其特征在于,其中根据预设时间段生成至少两个滑动时间窗口,包括:
按照时间顺序将预设时间段[T-T0,T]划分为时间上连续的N个滑动时间窗口,其中,N为不小于2的自然数,T、T0为时间点。
3.根据权利要求1所述的方法,其特征在于,其中按照多个对象对每个滑动时间窗口中的信息项进行统计,以获得每个对象在每个滑动时间窗口中的信息项的数量,包括:
确定各个信息项的发布时间;
按照发布时间将每个信息项划分到各自对应的滑动时间窗口中,以使得每个滑动时间窗口中包括多个信息项;
统计对象Sj在第n个滑动时间窗口中的信息项的数量Cnj,其中,1≤n≤N,N为滑动时间窗口的数量,N为不小于2的自然数,1≤j≤M,M为对象的数量并且M为自然数,Sj为第j个对象,j为自然数。
4.根据权利要求3所述的方法,其特征在于,其中根据每个滑动时间窗口中的信息项的数量从多个对象中确定目标对象,包括:
对于相邻的两个滑动时间窗口中的对象Sj,计算对象Sj在相邻两个滑动时间窗口中的信息项的数量的比值Pij,其中,1≤i≤N-1;
将比值Pij与预先设置的阈值Y进行比较,以基于比较的结果确定目标对象。
5.根据权利要求4所述的方法,其特征在于,其中将比值Pij与预先设置的阈值Y进行比较,以基于比较的结果确定目标对象,包括:
将每个比值Pij与预先设置的阈值Y进行比较,当比较的结果为任意一个比值PijY时,确定对象Sj为目标对象;和/或,
将各个比值Pij分别与预先设置的阈值Y进行比较,当比较的结果为全部比值PijY时,确定对象Sj为目标对象;和/或,
将各个比值Pij分别与预先设置的阈值Y进行比较,当比较的结果为存在P(i+1)jYPij的情况时,计算对象Sj的各个比值Pij的平均值Pj;
当平均值PjY时,确定对象Sj为目标对象。
6.根据权利要求4所述的方法,其特征在于,其中对于相邻的两个滑动时间窗口中的对象Sj,计算对象Sj在相邻两个滑动时间窗口中的信息项的数量的比值Pij,其计算公式为:
Pij=[C(n+1)j+1]/(Cnj+1)
式中,1≤i≤N-1,1≤n≤N,1≤j≤M,M为对象的数量,n,i,j为自然数。
7.根据权利要求1至6任一所述的方法,其特征在于,所述方法还包括,当经过时间t,出现新的舆情内容时,采集时间段[T,T+t]的舆情内容,将时间段[T+t-T0,T+t]的舆情内容作为预设时间段内获取的舆情内容,并令T+t=T。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金堤科技有限公司,未经北京金堤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111254647.3/1.html,转载请声明来源钻瓜专利网。