[发明专利]一种视频处理方法、系统、设备及介质、程序产品在审
| 申请号: | 202310615111.2 | 申请日: | 2023-05-29 |
| 公开(公告)号: | CN116597360A | 公开(公告)日: | 2023-08-15 |
| 发明(设计)人: | 尹君豪;杜春赛;康积华;杨晶生 | 申请(专利权)人: | 北京字跳网络技术有限公司 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06V30/14;G06V30/19 |
| 代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 冯柳伟 |
| 地址: | 100190 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 处理 方法 系统 设备 介质 程序 产品 | ||
本申请提供了一种视频处理方法、系统、设备及介质、程序产品。该方法包括:获取待处理的视频;根据待处理的视频,确定视频中的关键帧,关键帧为视频的多个图像帧中的至少一个;对关键帧的候选区域的内容进行识别,获得关键帧的描述信息;呈现关键帧的描述信息。该方法通过对视频中关键帧的候选区域的内容进行识别,可以获得关键帧的描述信息,在本申请的一些具体应用场景中,例如在视频会议场景中,可以获得视频当前演示的文档的标题,使得用户能够了解视频中多个关键帧的描述信息,从而便于用户进行视频定位,高效观看视频。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种视频处理方法、系统、设备以及计算机可读存储介质、计算机程序产品。
背景技术
视频(video)是以电信号方式加以捕捉、记录、处理、存储、传送与重现的动态影像。视频中通常承载有比较丰富的信息,例如视频内容可以包括具有大量文字的文档。以会议场景示例说明,参会人员可以对会议过程中演示的文档进行录制,获得记录有文档内容的视频,以便于其他人员通过该视频了解会议内容,或者参会人员通过该视频回顾会议内容。
用户在观看视频时,往往需要从头开始观看。若用户想要针对特定部分的内容进行观看,则需要定位到视频中的特定时间点,再从该特定时间点进行观看。然而,用户通常需要进行多次手动定位,才能确定与所要观看的特定部分对应的特定时间点,耗时耗力。
因此,业界亟需一种能够高效观看视频的视频处理方法。
发明内容
本申请提供了一种视频处理方法。该方法能够对视频中关键帧的描述信息进行定位,便于用户进行跳转观看,从而实现高效观看视频。本申请还提供了上述方法对应的系统、设备、计算机可读存储介质以及计算机程序产品。
第一方面,本申请提供了一种视频处理方法。所述方法包括:
获取待处理的视频;
根据所述待处理的视频,确定所述视频中的关键帧,所述关键帧为所述视频的多个图像帧中的至少一个;
对所述关键帧的候选区域的内容进行识别,获得所述关键帧的描述信息;
呈现所述关键帧的描述信息。
在一些可能的实现方式中,所述呈现所述关键帧的描述信息,包括:
在所述视频的导航区域呈现所述关键帧的描述信息;或者,
在所述视频的时间轴呈现所述关键帧的描述信息。
在一些可能的实现方式中,所述在所述视频的时间轴呈现所述关键帧的描述信息,包括:
基于所述关键帧在所述视频中的时间信息,与所述视频的时间轴关联展示所述关键帧的描述信息。
在一些可能的实现方式中,所述方法还包括:
响应于用户针对所述关键帧的描述信息的触发操作,将所述视频定位至与所述关键帧的描述信息对应的时间点,以使所述视频从所述时间点播放。
在一些可能的实现方式中,所述对所述关键帧的候选区域的内容进行识别,获得所述关键帧的描述信息,包括:
通过光学字符识别OCR对所述关键帧的候选区域的内容进行识别,获得所述候选区域的文字识别结果;
根据所述候选区域的文字识别结果,获得所述关键帧的描述信息。
在一些可能的实现方式中,所述根据所述候选区域的文字识别结果,获得所述关键帧的描述信息,包括:
根据设定的过滤条件,过滤所述候选区域的文字识别结果;
根据过滤后的文字识别结果,获得所述关键帧的描述信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字跳网络技术有限公司,未经北京字跳网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310615111.2/2.html,转载请声明来源钻瓜专利网。





