[发明专利]场景分割点判断方法、系统、存储介质及电子设备在审
申请号: | 202110835243.7 | 申请日: | 2021-07-23 |
公开(公告)号: | CN113569705A | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 胡郡郡;唐大闰 | 申请(专利权)人: | 上海明略人工智能(集团)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/08 |
代理公司: | 青岛清泰联信知识产权代理有限公司 37256 | 代理人: | 赵燕 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 场景 分割 判断 方法 系统 存储 介质 电子设备 | ||
本申请公开了一种场景分割点判断方法、系统、存储介质及电子设备,场景分割点判断方法包括:视频特征获取步骤:对视频进行划分获得多个所述视频等份,通过深度学习预训练模型对每个所述视频等份进行提取特征,获得对应每一所述视频等份的第一视频特征;模型处理步骤:将多个所述第一视频特征输入到基于注意力机制的视频场景分割点判断模型进行处理获得对应每一所述视频等份的分类概率;判断步骤:通过阈值对每个所述等份视频的分类概率进行判断确定场景分割点。本发明利用bert能够实现全局自主注意力机制,能够利用网络本身的比较强的注意力的能力实现场景分割。
技术领域
本发明属于场景分割点判断领域,具体涉及一种场景分割点判断方法、系统、存储介质及电子设备。
背景技术
基于事件检测的方法(Dence Boundary Generator)。但是此方法每个事件会有重叠的时间区域,而场景分割要求每个segment没有时间上的重叠。
发明内容
本申请实施例提供了一种场景分割点判断方法、系统、存储介质及电子设备,以至少解决现有的场景分割点判断方法分割事件时间区域重叠的问题。
本发明提供了一种场景分割点判断方法,其中,包括:
视频特征获取步骤:对视频进行划分获得多个视频等份,通过深度学习预训练模型对每个所述视频等份进行提取特征,获得对应每一所述视频等份的第一视频特征;
模型处理步骤:将多个所述第一视频特征输入到基于注意力机制的视频场景分割点判断模型进行处理获得对应每一所述视频等份的分类概率;
判断步骤:通过阈值对每个所述视频等份的分类概率进行判断确定场景分割点。
上述场景分割点判断方法,其中,所述视频特征获取步骤包括:
视频等份获得步骤:将所述视频按照时间分成多个所述视频等份;
获得视频特征维度步骤:使用所述深度学习预训练模型对每个所述视频等份进行特征提取,获得对应每个所述视频等份的所述第一视频特征。
上述场景分割点判断方法,其中,所述模型处理步骤包括:
样本视频等份获得步骤:将样本视频按照时间分成多个样本视频等份;
获得样本视频特征维度步骤:使用所述深度学习预训练模型对每个所述样本视频等份提取特征,获得对应每个所述样本视屏等份的第一样本特征;
模型构建步骤:构建所述分割点判断模型并通过所述第一样本特征对所述分割点判断模型进行训练;
分类概率获得步骤:根据所述第一视频特征通过训练后的所述分割点判断模型获得对应每一所述视频等份的分类概率。
上述场景分割点判断方法,其中,所述模型构建步骤包括:
分割点构建步骤:根据所述第一样本特征构造每一分场景分割点的第二样本特征;
第二样本特征处理步骤:搭建并通过bert网络层对所述第二样本特征进行处理获得第三样本特征;
预测步骤:搭建并通过Predictor网络对所述第三样本特征进行预测获得样本场景分割点;
约束步骤:通过分类损失函数和一致性正则化损失函数对所述样本场景分割点进行约束。
本发明还提供了一种场景分割点判断系统,其中,包括:
视频特征获取模块,所述视频特征获取模块对视频进行划分获得多个视频等份,通过深度学习预训练模型对每个所述视频等份进行提取特征,获得对应每一所述视频等份的第一视频特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海明略人工智能(集团)有限公司,未经上海明略人工智能(集团)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110835243.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于AlN单晶扩径生长的PVT装置
- 下一篇:构造柱施工方法