[发明专利]视频分段方法和视频分段装置有效
申请号: | 201910376477.2 | 申请日: | 2019-05-07 |
公开(公告)号: | CN111918145B | 公开(公告)日: | 2022-09-09 |
发明(设计)人: | 苏芸 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04N21/845 | 分类号: | H04N21/845;H04N21/8549;H04N21/439 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 周乔;王君 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 分段 方法 装置 | ||
本申请提供一种视频分段方法和视频分段装置,该方法包括:视频分段装置根据事先上传的用于描述待处理视频内容的内容描述信息和待处理视频中演示的演示文稿中的至少一个和该待处理视频的语音信息,对该待处理视频进行分段。上述技术方案可以结合除待处理视频本身的内容以外的信息,对该待处理视频进行分段,从而可以提高分段的准确性。
技术领域
本申请涉及信息技术领域,更具体地,涉及视频分段方法和视频分段装置。
背景技术
为了便于方便地观看视频,可以将一个完整的视频划分为多个分段。这样,用户可以直接观看感兴趣的分段。
目前一种常见的视频分段方法是基于视频中的文字信息对视频分段的。上述视频中的文字信息可以是视频中的字幕,或者是对视频进行语音识别得到的文字。换句话说,目前对视频进行分段的基础都是来自于视频本身。此外,目前这种基于视频中的文字信息视频分段需要获取视频的全部文字信息。直播视频的视频流是实时产生的。因此,只有在视频直播结束之后,才能得到视频的全部文字信息。因此,上述方法并不能对直播视频进行实时分段。此外上述方法只是根据视频的文字信息对视频进行分段。这样可能会造成确定的分段点并不一定是合适的分段点。
发明内容
本申请提供一种视频分段方法和视频分段装置,能够提高视频分段的准确性。
第一方面,本申请实施例提供一种视频分段方法,包括:视频分段装置获取待处理视频的文本信息和该待处理视频的语音信息,其中该文本信息包括该待处理视频中的演示文稿和该待处理视频的内容描述信息中的至少一个;该视频分段装置根据该文本信息和该语音信息,确定该待处理视频的分段点;该视频分段装置根据该分段点,对该待处理视频进行分段。上述技术方案可以结合除待处理视频本身的内容以外的信息,对该待处理视频进行分段,从而可以提高分段的准确性。
结合第一方面,在第一方面的一种可能的实现方式中,在该文本信息包括该演示文稿的情况下,该视频分段装置根据该文本信息和该语音信息,确定该待处理视频的分段点,包括:确定该演示文稿的切换点,该演示文稿在该切换点前后呈现的内容不同;根据该语音信息,确定至少一个停顿点;根据该切换点和该至少一个停顿点,确定该分段点。演示文稿发生切换往往意味着演讲人的演讲的内容发生了变化。因此,上述技术方案通过考虑演示文稿的变化,将待处理视频划分为不用的分段,可以合理地快速确定待处理视频的分段点。另外,上述技术方案在确定待处理视频的分段点时,只需要基于演示文稿的切换点以及切换点附近的停顿点。因此,上述技术方案不需要获取完成的视频文件,就可以对视频进行分段。换句话说,利用上述技术方案可以实时对待处理视频进行分段。因此,上述技术方案可应用于直播视频的分段处理。
结合第一方面,在第一方面的一种可能的实现方式中,该根据该切换点和该至少一个停顿点,确定该分段点,包括:在确定该切换点与该至少一个停顿点中的一个停顿点相同的情况下,确定该切换点为该分段点;在确定该至少一个停顿点中的任一个停顿点与该切换点的均不相同的情况下,确定该至少一个停顿点中距离该切换点最近的一个停顿点为该分段点。
结合第一方面,在第一方面的一种可能的实现方式中,该确定该演示文稿的切换点,包括:确定获取到用于指示切换该演示文稿的内容的切换信号的时刻为该切换点。
结合第一方面,在第一方面的一种可能的实现方式中,该文本信息还包括该内容描述信息,在该视频分段装置根据该文本信息和该语音信息,确定该待处理视频的分段点之前,该方法还包括:确定该演示文稿的当前页的演示时长小于或等于第一预设时长且大于第二预设时长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910376477.2/2.html,转载请声明来源钻瓜专利网。