[发明专利]视频语义标注方法、装置、设备及存储介质在审
申请号: | 202110002075.3 | 申请日: | 2021-01-04 |
公开(公告)号: | CN113392690A | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 刘刚 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N20/00;A63F13/52;A63F13/837;A63F13/847 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 语义 标注 方法 装置 设备 存储 介质 | ||
1.一种视频语义标注方法,其特征在于,所述方法包括:
获取视频中的视频帧序列;
从所述视频帧序列中的视频帧中提取至少两个维度的多模态信息;
基于所述至少两个维度的多模态信息的组合在至少两个剧情事件中匹配出的目标剧情事件,确定为所述视频帧的剧情事件;
根据所述视频帧的剧情事件对所述视频帧序列进行语义标注,得到所述视频的语义信息。
2.根据权利要求1所述的方法,其特征在于,所述根据所述视频帧的剧情事件对所述视频帧序列进行语义标注,得到所述视频的语义信息,包括:
确定具有相同的所述剧情事件的多个连续视频帧所属的视频片段在所述视频帧序列中的开始时间戳和结束时间戳;
根据所述剧情事件、所述开始时间戳和所述结束时间戳对所述视频片段进行语义标注,得到所述视频中所述视频片段对应的语义信息。
3.根据权利要求2所述的方法,其特征在于,所述基于所述至少两个维度的多模态信息的组合在至少两个剧情事件中匹配出的目标剧情事件,确定为所述视频帧的剧情事件,包括:
获取对应关系,所述对应关系用于表征所述多模态信息组合后的事件与目标剧情事件之间的对应关系;
根据所述对应关系和所述多模态信息组合后的事件获取所述目标剧情事件,将所述目标剧情事件确定为所述视频帧的剧情事件。
4.根据权利要求1至3任一所述的方法,其特征在于,所述视频帧序列中的视频帧包括虚拟环境画面和至少一个控件,所述虚拟环境画面包括以第一虚拟角色活动时所在的虚拟环境的画面;
所述从所述视频帧序列中的视频帧中提取至少两个维度的多模态信息,包括:
调用第一信息提取模型从所述虚拟环境画面中提取虚拟元素信息,所述虚拟元素信息包括所述虚拟环境画面中的活动元素和静止元素中至少一种元素对应的信息;
调用第二信息提取模型从所述控件中提取对局信息,所述对局信息包括所述控件中与所述第一虚拟角色对应的信息。
5.根据权利要求4所述的方法,其特征在于,所述虚拟元素信息包括所述第一虚拟角色对应的角色标识,所述第一信息提取模型包括元素分类模型和定位跟踪模型;
所述调用第一信息提取模型从所述虚拟环境画面中提取虚拟元素信息,包括:
获取参与对局的所述第一虚拟角色的第一角色标识;
调用所述元素分类模型对所述虚拟环境画面中的所述第一虚拟角色对应的生命值区域进行识别,得到所述生命值区域对应的所述第一虚拟角色的第二角色标识;
响应于所述第一角色标识与所述第二角色标识匹配,得到所述第二角色标识对应的第一置信度;
调用所述定位跟踪模型根据所述第一角色标识对所述虚拟环境画面中的第一虚拟角色进行识别,得到显示在所述虚拟环境画面中的所述第一虚拟角色的第三角色标识,所述第三角色标识对应有第二置信度,所述定位跟踪模型与参与对局的所述第一虚拟角色一一对应;
根据所述第一置信度和所述第二置信度获得所述第一虚拟角色的角色标识。
6.根据权利要求4所述的方法,其特征在于,所述虚拟元素信息包括所述虚拟环境中的建筑物元素对应的位置信息,所述第一信息提取模型包括第一卷积神经网络;
所述调用第一信息提取模型从所述虚拟环境画面中提取虚拟元素信息,包括:
从所述虚拟环境画面中提取所述建筑物元素对应的建筑物元素特征;
将所述建筑物元素特征与预设建筑物元素特征进行匹配,得到第一匹配特征;
调用所述第一卷积神经网络对所述第一匹配特征进行分类,得到所述建筑物元素对应的位置信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110002075.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:墨组合物和包括该墨组合物的发光器件
- 下一篇:驾驶辅助装置