[发明专利]视频数据中特定对象检测方法及装置、计算设备在审
申请号: | 201711156357.9 | 申请日: | 2017-11-20 |
公开(公告)号: | CN107944374A | 公开(公告)日: | 2018-04-20 |
发明(设计)人: | 董健 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06F17/30 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙)11276 | 代理人: | 宋菲 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 数据 特定 对象 检测 方法 装置 计算 设备 | ||
技术领域
本发明涉及深度学习领域,具体涉及一种视频数据中特定对象检测方法及装置、计算设备。
背景技术
随着网络技术的发展,用户可以从互联网获取到海量的视频数据。对于用户而言,仅希望从海量的视频数据中获取自己感兴趣的视频数据。以某明星的粉丝为例,粉丝仅关注有该明星出现的视频数据;对于安装安防监控的公司或家庭来说,关注监控的视频数据中是否有其他陌生人出入。
现有技术中,视频数据可以采用人工审核的方法,来确定视频数据中是否包含特定对象。但采用人工审核方法需要投入大量的人力,增加了审核成本,而且审核效率低。或者现有技术采用神经网络对视频数据进行检测。但一般采用的神经网络往往具有多层中间层,其可以得到精准的检测结果,但多层中间层的计算速度会较慢,不能快速的对视频进行检测,无法及时反馈给用户检测结果。且用户在获取视频数据时更多的使用如移动设备等,移动设备所能运行的神经网络一般为中间层较少的神经网络,由于中间层层数较少,其计算速度较快,但受其层数限制,有可能造成计算能力有限、拟合能力较差、得到结果不准确等问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的视频数据中特定对象检测方法及装置、计算设备。
根据本发明的一个方面,提供了一种视频数据中特定对象检测方法,其包括:
获取视频数据;
将视频数据输入至第二神经网络中,得到视频数据的检测结果;其中,第二神经网络利用预先训练的第一神经网络的至少一层中间层的输出数据进行指导训练得到,第一神经网络的层数多于第二神经网络的层数;
根据视频数据的检测结果,确定视频数据的标签属性信息;
根据视频数据的标签属性信息,对视频数据进行标记。
可选地,获取视频数据进一步包括:
获取本地视频数据和/或网络视频数据。
可选地,视频数据的检测结果包含特定对象出现的时长;
根据视频数据的检测结果,确定视频数据的标签属性信息进一步包括:
判断视频数据的检测结果中特定对象出现的时长与视频数据时长的比例是否大于预设时长比例;
若是,将特定对象设置为视频数据的标签属性信息。
可选地,视频数据的检测结果包含特定对象出现的次数;
根据视频数据的检测结果,确定视频数据的标签属性信息进一步包括:
判断视频数据的检测结果中特定对象出现的频率是否大于预设频率值;
若是,将特定对象设置为视频数据的标签属性信息。
可选地,视频数据的检测结果包含特定对象的场景信息;
根据视频数据的检测结果,确定视频数据的标签属性信息进一步包括:
根据视频数据的检测结果,将特定对象以及场景设置为视频数据的标签属性信息。
可选地,方法还包括:
获取用户终端的观看视频数据的偏好;
根据视频数据的检测结果和用户终端的偏好,向用户终端推送符合用户终端的偏好的视频数据。
可选地,第二神经网络的训练过程包括:
将特定对象检测的训练样本数据输入至经训练得到的第一神经网络中,获得第一神经网络的至少一层第一中间层的输出数据;
将特定对象检测的训练样本数据输入至待训练的第二神经网络中,获得第二神经网络的至少一层第二中间层的输出数据以及最终输出数据,至少一层第二中间层与至少一层第一中间层具有对应关系;
利用至少一层第二中间层的输出数据与至少一层第一中间层的输出数据之间的损失,以及最终输出数据与预标注的输出数据之间的损失,对第二神经网络进行训练。
可选地,至少一层第一中间层包含第一神经网络的瓶颈层;至少一层第二中间层包含第二神经网络的瓶颈层。
可选地,利用至少一层第二中间层的输出数据与至少一层第一中间层的输出数据之间的损失,以及最终输出数据与预标注的输出数据之间的损失,对第二神经网络进行训练进一步包括:
根据至少一层第二中间层的输出数据与至少一层第一中间层的输出数据之间的损失更新第二神经网络的权重参数,根据最终输出数据与预标注的输出数据之间的损失更新第二神经网络的权重参数,对第二神经网络进行训练。
可选地,在将训练样本的输入数据输入至待训练的第二神经网络中,获得第二神经网络的至少一层第二中间层的输出数据以及最终输出数据之前,方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711156357.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置