[发明专利]一种确定目标对象的方法和装置在审
申请号: | 202111254647.3 | 申请日: | 2021-10-27 |
公开(公告)号: | CN113987371A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 李凯;周晗 | 申请(专利权)人: | 北京金堤科技有限公司 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/2458;G06F16/248 |
代理公司: | 北京工信联合知识产权代理有限公司 11266 | 代理人: | 刘爱丽 |
地址: | 100086 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 确定 目标 对象 方法 装置 | ||
本发明实施例公开了一种确定目标对象的方法和装置、以及存储介质和电子设备,其中,方法包括:将预设时间段内的舆情内容划分到多个滑动时间窗口,按照多个对象对每个滑动时间窗口中的信息项进行统计,获得每个对象在每个滑动时间窗口中的信息项的数量,最后根据每个滑动时间窗口中的信息项的数量从多个对象中确定目标对象。本发明的方法和装置能在大量的舆情内容中快速地捕获目标对象,且当滑动时间窗口选择合适时,对内存占用少,从而帮助用户及时发现目标对象,大大节省了用户筛选对象的时间,提高了用户决策的效率。
技术领域
本发明涉及数据挖掘技术领域,并且更具体地,涉及一种确定目标对象的方法和装置、以及存储介质和电子设备。
背景技术
目前,每天都会有大量的舆情内容产生,不同的舆情内容关联的对象也不相同。有些用户会希望挖掘出在一定时间内存在显著舆情内容变化的目标对象。例如,在针对新闻数据的挖掘中,目标对象通常是指存在热门新闻舆情的对象,从而能够根据目标对象的信息快速地发现有关目标对象的重要动态,为及时做出决策提供重要依据。但由于信息的数量庞大以及内容繁杂,导致有决策需求的用户无法从众多的舆情内容中及时高效地挖掘出目标对象,因此无法满足用户后续针对目标对象的舆情内容挖掘和辅助决策的需求。
发明内容
为了解决现有技术中对于有决策需求的用户无法从众多的舆情内容中及时高效地挖掘目标对象的技术问题,本发明的实施例提供一种确定目标对象的方法和装置,以及存储介质和电子设备。
根据本发明实施例的一个方面,提供一种确定目标对象的方法,所述方法包括:
获取预设时间段内的舆情内容,并根据预设时间段生成至少两个滑动时间窗口,其中,所述舆情内容包括信息项;
按照多个对象对每个滑动时间窗口中的信息项进行统计,以获得每个对象在每个滑动时间窗口中的信息项的数量;以及
根据每个对象在每个滑动时间窗口中的信息项的数量从多个对象中确定目标对象。
可选地,在本发明上述各方法实施例中,其中根据预设时间段生成至少两个滑动时间窗口,包括:
按照时间顺序将预设时间段[T-T0,T]划分为时间上连续的N个滑动时间窗口,其中,N为不小于2的自然数,T、T0为时间点。
可选地,在本发明上述各方法实施例中,其中按照多个对象对每个滑动时间窗口中的信息项进行统计,以获得每个对象在每个滑动时间窗口中的信息项的数量,包括:
确定各个信息项的发布时间;
按照发布时间将每个信息项划分到各自对应的滑动时间窗口中,以使得每个滑动时间窗口中包括多个信息项;
统计对象Sj在第n个滑动时间窗口中的信息项的数量Cnj,其中,1≤n≤N,N为滑动时间窗口的数量,N为不小于2的自然数,1≤j≤M,M为对象的数量并且M为自然数,Sj为第j个对象,j为自然数。
可选地,在本发明上述各方法实施例中,其中根据每个滑动时间窗口中的信息项的数量从多个对象中确定目标对象包括:
对于相邻的两个滑动时间窗口中的对象Sj,计算对象Sj在相邻两个滑动时间窗口中的信息项的数量的比值Pij,其中,1≤i≤N-1;
将比值Pij与预先设置的阈值Y进行比较,以基于比较的结果确定目标对象。
可选地,在本发明上述各方法实施例中,其中将比值Pij与预先设置的阈值Y进行比较,以基于比较的结果确定目标对象,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金堤科技有限公司,未经北京金堤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111254647.3/2.html,转载请声明来源钻瓜专利网。