[发明专利]一种基于深度学习的智能无人摄影方法和系统有效
申请号: | 201711098877.9 | 申请日: | 2017-11-09 |
公开(公告)号: | CN107749952B | 公开(公告)日: | 2020-04-10 |
发明(设计)人: | 张明;于佳弘;刘博;杨星彤 | 申请(专利权)人: | 睿魔智能科技(东莞)有限公司;杭州灵凡科技有限公司 |
主分类号: | H04N5/232 | 分类号: | H04N5/232;G06N3/08;G05D3/12 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 罗晓林;杨桂洋 |
地址: | 523000 广东省东莞市松山湖高新技术*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 智能 无人 摄影 方法 系统 | ||
1.一种基于深度学习的智能无人摄影方法,包括以下步骤:
将摄影机架设在控制云台上,开启摄影机对目标对象进行视频拍摄;
对目标对象进行感知,获取目标对象的特征要素;
构图,对目标对象的特征要素进行基于深度神经网络的深度学习,完成当前画面的构图;
根据构图情况,向云台和摄影机发送控制指令,使云台运动至指定方向,以及使摄影机自动变焦,使得目标对象始终位于拍摄画面中的合适位置。
2.根据权利要求1所述的基于深度学习的智能无人摄影方法,其特征在于,所述构图时,建立智能构图深度神经网络的训练数据集,根据拍摄得到的二维图像和视频,从该二维图像和视频中提取目标对象的骨架模型;
根据三分线构图法得到当前画面中固定的参考线,根据中心构图法得到当前画面中固定的参考点,获取骨架模型中关键点和参考点的距离和以及骨架模型中关键线段和参考线的夹角和的加权和,使该加权和的值最小,从而将骨架模型置于当前画面中的最优位置,该二维图像、视频以及骨架模型最优位置标签信息构成了构图智能深度神经网络的训练数据集;
用该训练集对初始的深度神经网络进行训练,得到了智能构图深度神经网络。
3.根据权利要求2所述的基于深度学习的智能无人摄影方法,其特征在于,将包含目标对象或者目标对象一部分的图像输入得到的智能构图深度神经网络,即得到人体下一步移动到的最优位置及对变焦控制的输出,向云台和摄影机输出下一步运动的控制指令,使目标对象始终保持在摄影画面中。
4.根据权利要求3所述的基于深度学习的智能无人摄影方法,其特征在于,所述将骨架模型置于当前画面中的最优位置之前,还按照预设比例值优化目标对象在当前画面中的比例。
5.根据权利要求4所述的基于深度学习的智能无人摄影方法,其特征在于,所述目标对象的特征要素包括所在场景、位置、大小、距离、行为和姿态。
6.一种基于深度学习的智能无人摄影系统,其特征在于,所述系统包括感知单元,用于感知目标对象的特征要素;
学习单元,用于对目标对象的特征要素基于深度神经网络的深度学习;
构图单元,用于建立构图智能神经网络,对目标对象进行实时构图,获取目标对象在当前画面中的最优位置;
控制单元,控制云台调整角度和摄影机自动变焦。
7.根据权利要求6所述的基于深度学习的智能无人摄影系统,其特征在于,所述系统还包括优化单元,用于优化目标对象在当前画面中所占的比例。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于睿魔智能科技(东莞)有限公司;杭州灵凡科技有限公司,未经睿魔智能科技(东莞)有限公司;杭州灵凡科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711098877.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:输煤系统的照明装置
- 下一篇:一种城市LED路灯远程智能控制装置