[发明专利]视频识别确定方法、装置、电子设备及存储介质在审
申请号: | 202110960483.X | 申请日: | 2021-08-20 |
公开(公告)号: | CN113673427A | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 徐海良;高金楠;李瑶 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 宁立存 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 识别 确定 方法 装置 电子设备 存储 介质 | ||
本公开关于一种视频识别方法、装置、电子设备及存储介质,涉及互联网技术领域;包括:确定待识别的第一视频的文字识别标签、对象识别标签和图像分类结果;在图像分类结果用于表示第一视频中包含限制性图像的情况下,获取第一视频的视频特征;基于视频特征,确定第一视频的视频识别标签,视频识别标签用于表示限制性图像的类型;基于文字识别标签、对象识别标签和视频识别标签三者之间的优先级关系,确定第一视频的识别结果。上述方案中,在第一阶段对视频进行一个筛选,在筛选出图像分类标签表示该视频中包含限制性图像的情况下,才执行第二阶段的视频标签的识别,从而节省了运算资源。
技术领域
本公开涉及互联网技术领域,尤其涉及一种视频识别方法、装置、电子设备及存储介质。
背景技术
随着互联网技术的发展,用户可以通过短视频平台向其他用户分享视频。而短视频平台是一个传播积极生活态度的平台,为了避免不法分子通过短视频平台分享包含限制性内容的视频,例如包括不良内容的视频等。因此,需要对用户上传的视频进行识别,在确定该视频的识别结果为该视频不包含限制性内容的情况下,分享该视频,从而防止包含限制性内容的视频的传播。
相关技术中,事先训练视频识别模型,该视频识别模型可以识别出待识别视频的视频标签,例如该视频识别模型包含限制性内容的视频标签有N个,N为正整数,则该视频识别模型相当于一个N+1的分类模型;在对视频进行识别时,将该视频输入该视频识别模型中,输出该视频的识别结果,该识别结果为该视频不包含限制性内容,或者该识别结果为该视频包含限制性内容且该视频包含的限制性内容的视频标签。
由于无论该视频是否包含限制性内容,均需要通过该视频识别模型进行识别,从而导致运算资源消耗较大。
发明内容
本公开提供一种视频识别方法、装置、电子设备及存储介质,能够提高视频识别的效率。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种视频识别方法,包括:
确定待识别的第一视频的文字识别标签、对象识别标签和图像分类结果,所述图像分类结果用于表示所述第一视频中是否包含限制性图像;
在所述图像分类结果用于表示所述第一视频中包含限制性图像的情况下,获取所述第一视频的视频特征;
基于所述视频特征,确定所述第一视频的视频识别标签,所述视频识别标签用于表示所述限制性图像的类型;
基于所述文字识别标签、所述对象识别标签和所述视频识别标签三者之间的优先级关系,确定所述第一视频的识别结果。
在一些实施例中,所述确定待识别的第一视频的文字识别标签、对象识别标签和图像分类结果,包括:
在所述第一视频的每帧视频上标注待提取的特征的标识信息;
将标注后的所述每帧视频输入到多任务处理模型中,所述多任务处理模型包括特征判断模块、特征提取模块、文字识别模块、对象识别模块和图像分类模块;
对于每帧视频,通过所述特征判断模块,确定所述帧视频上标注的是用于提取文字特征的第一标识信息,则通过所述特征判断模块指示所述特征提取模块提取所述帧视频的文字特征,将所述文字特征输出至所述文字识别模块;
通过所述特征判断模块,确定所述帧视频上标注的是用于提取对象特征的第二标识信息,则通过所述特征判断模块指示所述特征提取模块提取所述帧视频的对象特征,将所述对象特征输出至所述对象识别模块;
通过所述特征判断模块,确定所述帧视频上标注的是用于提取图像特征的第三标识信息,则通过所述特征判断模块指示所述特征提取模块提取所述帧视频的图像特征,将所述图像特征输出至所述图像分类模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110960483.X/2.html,转载请声明来源钻瓜专利网。