[发明专利]视频的话题处理方法、装置、电子设备及存储介质有效
申请号: | 201910770189.5 | 申请日: | 2019-08-20 |
公开(公告)号: | CN110489593B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 何奕江;郑茂 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/75 | 分类号: | G06F16/75 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 赵翠萍;张颖玲 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 话题 处理 方法 装置 电子设备 存储 介质 | ||
1.一种视频的话题处理方法,其特征在于,所述方法包括:
获取视频对应的视频文本;
当所述视频文本的数据量小于数据量阈值时,从所述视频中提取视频帧形成视频帧集合;
通过神经网络模型从所述视频帧集合中的每个视频帧提取图像特征,将所提取的图像特征连接并转换为对应多个视觉词的视觉词概率;
当所述视觉词概率大于视觉词概率阈值时,确定所述视觉词概率对应的视觉词为有效视觉词;
基于所述有效视觉词形成第一词语集合,并从所述视频文本提取第二词语集合;
当所述视频文本的数据量小于数据量阈值时,基于所述第一词语集合和所述第二词语集合中每个词,获取所述视频属于话题集合中每个话题的概率;
当所述视频文本的数据量大于或等于数据量阈值时,基于所述第二词语集合中每个词,获取所述视频属于所述话题集合中每个话题的概率;
当所述概率超过话题概率阈值时,确定所述概率对应的话题为所述视频归属的话题。
2.根据权利要求1所述的方法,其特征在于,所述从所述视频中提取视频帧形成视频帧集合,包括:
每隔一段采样时间对所述视频进行抽帧处理,以形成所述视频帧集合;或者
获取所述视频的关键情节位置,抽取所述关键情节位置对应的视频帧以形成所述视频帧集合。
3.根据权利要求1所述的方法,其特征在于,所述基于所述有效视觉词形成第一词语集合,包括:
获取所述有效视觉词在所述视频帧集合的所有视频帧的出现次数;
当所述出现次数大于有效视觉词阈值时,将所述出现次数大于所述有效视觉词阈值的有效视觉词组合,以形成所述第一词语集合。
4.根据权利要求1所述的方法,其特征在于,所述从所述视频文本提取第二词语集合,包括:
通过条件随机场分别对所述视频文本进行分词处理以及标注词性处理,以获得有效文本词集合;
确定所述有效文本词集合中的每个有效文本词的逆向文件频率;
当所述逆向文件频率大于逆向文件频率阈值时,将所述逆向文件频率大于所述逆向文件频率阈值的有效文本词组合,以形成所述第二词语集合。
5.根据权利要求3所述的方法,其特征在于,所述方法还包括:
将所述第一词语集合中的有效视觉词的出现次数,映射到与有效文本词的出现次数相同的取值区间,以更新所述有效视觉词的出现次数;
其中,所述有效文本词为所述第二词语集合中用于表征视频文本的语义的词语。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于客户端的登录操作,获取对应于登录账号的历史浏览话题;
当所述视频对应的话题与所述历史浏览话题匹配时,将所述视频确定为待推荐视频。
7.根据权利要求6所述的方法,其特征在于,所述当所述视频对应的话题与所述历史浏览话题匹配时,将所述视频确定为待推荐视频,包括:
基于所述视频对应的话题以及所述历史浏览话题,确定所述视频对应的话题与所述历史浏览话题之间的距离;
当所述距离小于距离阈值时,确定所述视频对应的话题与所述历史浏览话题匹配,并将所述视频确定为待推荐视频。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910770189.5/1.html,转载请声明来源钻瓜专利网。