[发明专利]视频分割方法及装置有效
申请号: | 201911352570.6 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111046839B | 公开(公告)日: | 2023-05-19 |
发明(设计)人: | 干紫乔;冯晓峰;王思梦;赵金鑫;秦瑞雄;胡智;杜嘉;吴想想;熊威;蔡晨;祁缘 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06V20/40 | 分类号: | G06V20/40;G06F16/35;G06V10/762 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 赵平;周永君 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分割 方法 装置 | ||
本发明提供一种视频分割方法及装置,方法包括:通过获取视频文件对应的字幕文本并基于所述字幕文本生成文本向量;基于所述文本向量进行聚类处理得到层次聚类树状图;确定用于根据所述层次聚类树状图上符合约束条件的任意一组节点计算该组节点对应的代价值的熵函数;根据所述熵函数确定所述层次聚类树状图上目标组节点;基于所述目标组节点对所述视频文件进行分割。本发明能够使得优化的切分结果内容更精准,视频长度更符合使用者预期,实现更智能实用的微课切分优化。
技术领域
本发明涉及视频处理技术领域,具体涉及一种视频分割方法及装置。
背景技术
随着网络应用领域的不断发展,越来越多的用户选择通过网络视频进行网络学习。网络学习的网络视频资源多以长视频类为主,通常长视频的视频时长在20分钟至180分钟之间。受制于用户学习时间的限制,导致长视频的推广性不如新出现的短视频,通常短视频的视频时长在3分钟至10分钟之间。
为了提高用户体验,将长视频进行切分得到短视频。目前,采用基于语义聚类算法的方式将长视频分割为短视频,该方式能够将相似的语句合并形成段落,段落之间为最佳切分的切割点。
但是,基于语义聚类算法的分割方式会导致切分后的短视频出现过长或者过短的情况,降低了分割的准确度,以及分割方式的适用性低。
发明内容
针对现有技术中的问题,本发明提供一种视频分割方法及装置,能够使得优化的切分结果内容更精准,视频长度更符合使用者预期,实现更智能实用的微课切分优化。
为解决上述技术问题,本发明提供以下技术方案:
第一方面,本发明提供一种视频分割方法,包括:
获取视频文件对应的字幕文本并基于所述字幕文本生成文本向量;
基于所述文本向量进行聚类处理得到层次聚类树状图;
确定用于根据所述层次聚类树状图上符合约束条件的任意一组节点计算该组节点对应的熵值的熵函数;根据所述熵函数确定所述层次聚类树状图上目标组节点;
基于所述目标组节点对所述视频文件进行分割。
进一步的,在所述基于所述目标组节点对所述视频文件进行分割之后,还包括:
确定分割得到的子视频文件,建立所述子视频文件与视频文件之间的关联关系。
其中,所述获取视频文件对应的字幕文本并基于所述字幕文本生成文本向量,包括:
采用语音识别的方式从所述视频文件中提取出字幕文本;其中,所述字幕文本包括多个字幕单元;
通过语言表征模型将所述字幕文本中各个字幕单元转换为各自对应的字幕向量;其中,所有字幕向量构成文本向量。
其中,所述语言表征模型为BERT模型。
其中,所述基于所述文本向量进行聚类处理得到层次聚类树状图,包括:
采用层次凝聚聚类算法对所述文本向量进行聚类处理得到层次聚类树状图。
其中,所述采用层次凝聚聚类算法对所述文本向量进行聚类处理得到层次聚类树状图,包括:
根据所述字幕文本中时间数据确定所述字幕文本中各个字幕单元的时长以及相邻字幕单元之间的停顿间隔;
基于各个字幕单元的时长以及相邻字幕单元之间的停顿间隔确定层次凝聚聚类算法中的相似度距离;
基于所述相似度距离对所述文本向量进行聚类处理得到层次聚类树状图。
其中,所述确定用于根据所述层次聚类树状图上符合约束条件的任意一组节点计算该组节点对应的熵值的熵函数,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911352570.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:含磷硼氮组合物微量润滑油及制备方法
- 下一篇:一种水性荧光涂料及其制备方法