[发明专利]基于弹幕情感的视频热点片段检测方法、装置及存储介质有效
申请号: | 202110019644.5 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112699831B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 吴渝;张运凯;杨杰;李芊 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/74;G06F40/242;G06F40/253;G06F40/284;G06K9/62 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 李朝虎 |
地址: | 400000 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 弹幕 情感 视频 热点 片段 检测 方法 装置 存储 介质 | ||
本发明公开了基于弹幕情感的视频热点片段检测方法、装置及存储介质,包括对获取到的弹幕视频进行清洗,并对清洗后的弹幕视频进行切分,构造弹幕情感词典,对视频片段中的弹幕进行情感强度计算和整体情感倾向进行判定;计算相邻视频片段的情感强度变化率;使用LDA主题模型进行主题提取,计算相邻视频片段的主题相似度;构造热点视频片段检测模型;将需要检测的弹幕视频输入到模型中,得到热点视频片段。本发明构建的弹幕情感词典提升了弹幕情感强度计算准确度,弹幕情感强度计算方法能够得到更为准确的情感强度计算结果,直接对应弹幕文本的分析满足用户利用情感倾向和关键词检索热点片段的需求,具有较高的检测准确度。
技术领域
本发明涉及网络舆情领域,具体涉及基于弹幕情感的视频热点片段检测方法、装置及存储介质。
背景技术
近年来,随着网络视频的流行,视频数量爆炸式增长,高效为用户群体推送高质量的符合内容需求和情感倾向的热点视频片段具有重要现实意义。而现有的视频网站检测视频热点片段方法主要有人工筛选剪辑、机器自动识别。对于日益产生的视频数据,人工剪辑方式效果不佳、耗时久、成本高,机器自动识别检测准确度低。
机器自动识别热点视频片段检测主要有两种方法,是基于视频中的弹幕数量与阈值的大小检测,是基于视频片段的情感特征检测。基于视频弹幕数量与阈值大小的检测方法,无法满足用户根据内容和情感倾向选择热点片段。基于视频片段的情感特征检测方法主要分为两类:一类是基于情感词典的方法,一类是基于有监督的机器学习方法。基于情感词典方法主要利用情感词典计算情感强度,但是弹幕文本口语化明显、网络新词多,情感强度计算不准确。基于有监督的机器学习方法需要大量标记语料,且无法量化情感强度。因此需要新的视频热点片段检测方法,可以满足用户利用情感倾向和关键词检索热点片段的需求,提高检测准确度。
发明内容
本发明提供基于弹幕情感的视频热点片段检测方法、装置及存储介质,利用情感倾向和关键词检索热点视频片段,提高热点视频片段检测准确度,本发明中热点视频片段的定义为:观众情感波动大且情感强度高的视频片段,且对于视频片段中出现的内容,讨论的话题集中。
本发明通过下述技术方案实现:
基于弹幕情感的视频热点片段检测方法,具体步骤包括:
步骤S1、对获取到的弹幕视频进行清洗,并对清洗后的弹幕视频进行切分,得到视频片段;
步骤S2、构造弹幕情感词典,使用构造的弹幕情感词典对步骤S2中视频片段中的弹幕进行情感强度计算,得到视频片段的整体情感强度,并根据整体情感强度对视频片段的整体情感倾向进行判定;
步骤S3、根据步骤S2中得到的各视频片段的整体情感强度,计算相邻视频片段的情感强度变化率;
步骤S4、使用LDA主题模型对视频片段进行主题提取,生成视频片段对应的主题-关键词概率分布,计算相邻视频片段的主题相似度;
步骤S5、对步骤S2中的视频片段的整体情感强度、步骤S3的相邻视频片段的情感强度变化率及步骤S4中的相邻视频片段的主题相似度设置阈值,构造热点视频片段检测模型;
步骤S6、将获取到的弹幕视频输入到热点视频片段检测模型中,得到弹幕视频的热点视频片段。
进一步优选,步骤S1的具体步骤包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110019644.5/2.html,转载请声明来源钻瓜专利网。