[发明专利]基于弹幕情感的视频热点片段检测方法、装置及存储介质有效
申请号: | 202110019644.5 | 申请日: | 2021-01-07 |
公开(公告)号: | CN112699831B | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 吴渝;张运凯;杨杰;李芊 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V10/74;G06F40/242;G06F40/253;G06F40/284;G06K9/62 |
代理公司: | 成都行之专利代理事务所(普通合伙) 51220 | 代理人: | 李朝虎 |
地址: | 400000 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 弹幕 情感 视频 热点 片段 检测 方法 装置 存储 介质 | ||
1.基于弹幕情感的视频热点片段检测方法,其特征在于,具体步骤包括:
步骤S1、对获取到的弹幕视频进行清洗,并对清洗后的弹幕视频进行切分,得到视频片段;
步骤S2、构造弹幕情感词典,使用构造的弹幕情感词典对步骤S2中视频片段中的弹幕进行情感强度计算,得到视频片段的整体情感强度,并根据整体情感强度对视频片段的整体情感倾向进行判定;
步骤S3、根据步骤S2中得到的各视频片段的整体情感强度,计算相邻视频片段的情感强度变化率;
步骤S4、使用LDA主题模型对视频片段进行主题提取,生成视频片段对应的主题-关键词概率分布,计算相邻视频片段的主题相似度;
步骤S5、对步骤S2中的视频片段的整体情感强度、步骤S3的相邻视频片段的情感强度变化率及步骤S4中的相邻视频片段的主题相似度设置阈值,构造热点视频片段检测模型;
步骤S6、将获取到的弹幕视频输入到热点视频片段检测模型中,得到弹幕视频的热点视频片段。
2.根据权利要求1所述的基于弹幕情感的视频热点片段检测方法,其特征在于,步骤S1的具体步骤包括:
对清洗后的弹幕视频进行切分,得到含有k个视频片段的弹幕视频分段集合V,V={s1,s2,…sk},sk代表弹幕视频分段集合V中第k个视频片段,sk的时间长度为定值Ts,将弹幕c定义为三元组(wc,tc,td),其中wc代表弹幕c中的关键词集合,tc代表弹幕c在弹幕视频中的时间戳,td代表弹幕发布的时间距离弹幕视频上线时间的天数。
3.根据权利要求1所述的基于弹幕情感的视频热点片段检测方法,其特征在于,步骤S2中构造弹幕情感词典的步骤包括:
采用大连理工大学情感本体库词典为初始词典,将情感分为7种:好、乐、哀、怒、惧、恶、惊,其中,乐和好属于正向情感,哀、怒、惧、恶和惊属于负向情感,将每种正向情感的强度分为1、3、5、7、9五档,负向情感分为-1、-3、-5、-7、-9五档;
在所述初始词典的基础上扩充弹幕颜表情词典,并确定颜表情权重;扩充语气词典;扩充否定词典,根据弹幕常用的否定副词,将否定副词的权重设为-1;扩充弹幕网络情感新词词典,从弹幕视频中和搜狗输入法的词库中整理筛选网络情感新词进行扩充,并定义所述网络情感新词的情感权重。
4.根据权利要求2所述的基于弹幕情感的视频热点片段检测方法,其特征在于,步骤S2中对视频片段的情感强度计算和情感倾向判定的具体过程为:
步骤S21、根据弹幕特有的时序性特征,计算视频片段中每条弹幕的情感强度,并根据计算的情感强度将弹幕定义为正向情感弹幕或负向情感弹幕,计算情感强度的公式如下:
其中,td为弹幕c发布的时间距离弹幕视频上线时间的天数,tsum是弹幕视频发布的总天数;表示弹幕中第j个情感词ej前有negj个否定副词和qj个程度副词修饰时的情感强度,Em为弹幕c中颜表情的权重,nm为弹幕c中颜表情的个数;当ei0时,定义弹幕c为正向情感弹幕,当ei≤0时定义弹幕c为负面情感弹幕;
步骤S22、将步骤S21中计算的每条弹幕的情感强度累加求和得到视频片段sk的整体情感强度
其中,Sc表示视频片段sk中弹幕的条数;
步骤S23、根据步骤S22的计算结果,定义情感倾向当时,定义视频片段sk的整体情感倾向为正向;
当时,定义视频片段sk的整体情感倾向为负向;
当时,定义视频片段sk的整体情感倾向为中性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110019644.5/1.html,转载请声明来源钻瓜专利网。