[发明专利]视频分割方法及装置有效
申请号: | 201911352570.6 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111046839B | 公开(公告)日: | 2023-05-19 |
发明(设计)人: | 干紫乔;冯晓峰;王思梦;赵金鑫;秦瑞雄;胡智;杜嘉;吴想想;熊威;蔡晨;祁缘 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06F16/35;G06V10/762 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 赵平;周永君 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分割 方法 装置 | ||
1.一种视频分割方法,其特征在于,包括:
获取视频文件对应的字幕文本并基于所述字幕文本生成文本向量;
基于所述文本向量进行聚类处理得到层次聚类树状图;
确定用于根据所述层次聚类树状图上符合约束条件的任意一组节点计算该组节点对应的熵值的熵函数;根据所述熵函数确定所述层次聚类树状图上目标组节点;
基于所述目标组节点对所述视频文件进行分割;
所述确定用于根据所述层次聚类树状图上符合约束条件的任意一组节点计算该组节点对应的熵值的熵函数,包括:
确定所述层次聚类树状图上符合约束条件的任意一组节点中每个节点对应的代价值;
所述熵函数用于对各个所述代价值确定该组节点对应的熵值;
所述根据所述熵函数确定所述层次聚类树状图上目标组节点,包括:
对所述熵函数进行求解确定所述熵函数能够得到的最小的熵值;
确定所述最小的熵值对应的一组节点为目标组节点。
2.根据权利要求1所述的视频分割方法,其特征在于,在所述基于所述目标组节点对所述视频文件进行分割之后,还包括:
确定分割得到的子视频文件,建立所述子视频文件与视频文件之间的关联关系。
3.根据权利要求1所述的视频分割方法,其特征在于,所述获取视频文件对应的字幕文本并基于所述字幕文本生成文本向量,包括:
采用语音识别的方式从所述视频文件中提取出字幕文本;其中,所述字幕文本包括多个字幕单元;
通过语言表征模型将所述字幕文本中各个字幕单元转换为各自对应的字幕向量;其中,所有字幕向量构成文本向量。
4.根据权利要求3所述的视频分割方法,其特征在于,所述语言表征模型为BERT模型。
5.根据权利要求1所述的视频分割方法,其特征在于,所述基于所述文本向量进行聚类处理得到层次聚类树状图,包括:
采用层次凝聚聚类算法对所述文本向量进行聚类处理得到层次聚类树状图。
6.根据权利要求5所述的视频分割方法,其特征在于,所述采用层次凝聚聚类算法对所述文本向量进行聚类处理得到层次聚类树状图,包括:
根据所述字幕文本中时间数据确定所述字幕文本中各个字幕单元的时长以及相邻字幕单元之间的停顿间隔;
基于各个字幕单元的时长以及相邻字幕单元之间的停顿间隔确定层次凝聚聚类算法中的相似度距离;
基于所述相似度距离对所述文本向量进行聚类处理得到层次聚类树状图。
7.根据权利要求1所述的视频分割方法,其特征在于,所述确定所述层次聚类树状图上符合约束条件的任意一组节点中每个节点对应的代价值,包括:
确定层次聚类树状图上符合约束条件的任意一组节点中每个节点对应的视频时长;
根据各个节点对应的视频时长和目标分割时长确定各个节点各自对应的代价值。
8.根据权利要求1所述的视频分割方法,其特征在于,所述熵函数用于对各个所述代价值确定该组节点对应的熵值,包括:
所述熵函数用于对各个所述代价值进行求和,确定求和结果为该组节点对应的熵值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911352570.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:含磷硼氮组合物微量润滑油及制备方法
- 下一篇:一种水性荧光涂料及其制备方法