[发明专利]一种基于深度学习的视频智能分析系统在审

专利信息
申请号: 201910490256.8 申请日: 2019-06-06
公开(公告)号: CN110232346A 公开(公告)日: 2019-09-13
发明(设计)人: 薛敏;喻飞;俞佳雯 申请(专利权)人: 南京睦泽信息科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/62;G06N3/04;G06N3/08
代理公司: 合肥初云专利代理事务所(普通合伙) 34152 代理人: 吴朝
地址: 210000 江苏省南京市*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 老师 视频智能分析系统 视频 评价指标 教学质量评估 视频处理模块 视频分析系统 行为分析模块 音频放大模块 语音处理模块 使用者提供 云端服务器 人工智能 摄像头 学生 动作跟踪 反馈结果 评价体系 情感分析 实时跟踪 学生情感 语音判断 综合评估 课堂 拾音器 判定 表情 上课 学习 教育 教学 分析
【权利要求书】:

1.一种基于深度学习的视频智能分析系统,其特征在于:包括摄像头、拾音器、视频处理模块、音频增强模块、表情/行为分析模块、语音处理模块、云端服务器模块,终端显示模块,所述表情/行为分析模块实时分析课堂中老师和学生的表情变化,根据老师和学生的行为变化进行表情分类,情感分析,所述摄像头和拾音器分别收集课堂视频和声音数据,对数据打包压缩,所述视频处理模块处理收集到的视频数据,对数据进行预处理操作数据清洗,所述音频增强模块处理收集到的语音数据,对语音数据波谱进行分型,所述语音处理模块提取收集到的语音音频中的语音特征,对语音特征分析,所述云端服务器模块为深度学习算法,机器学习算法提供算力支持,所述表情/行为分析模块分析课堂中的人脸,并对课堂中老师和学生的动作进行实时定位跟踪,通过分析学生上课的表情变化和动作行为判断该学生上课是否认真听课,根据老师的表情/行为评估老师的上课教学质量,所述语音识别模块用来判断老师上课的授课状态,通过分析老师的声音波谱的波动情况判断教师的情感状态,所述终端显示模块为用户提供可视化展示。

2.根据权利要求1中所述的一种基于深度学习的视频智能分析系统,其特征在于:所述摄像头和拾音器作用分别是收集课堂中的实时教学场景视频数据和课堂中的学生声音、老师声音、噪声、铃声,将收集到的视频数据和声音数据整理打包,压缩后分别传送到视频处理模块和音频增强模块。

3.根据权利要求1所述的一种基于深度学习的视频智能分析系统,其特征在于:所述视频处理模块作用是对输入进来的视频数据进行数据清洗,包括数据剪裁,格式转换操作,对传入的视频时长大小,视频帧率进行修正,并将损坏的视频数据剔除。

4.根据权利要求1所述的一种基于深度学习的视频智能分析系统,其特征在于:所述音频增强模块对收集来的语音数据进行信号放大,对声音信号增强,同时减弱一部分噪声,音频增强模块对音频数据中声音波谱波动幅度大于50%的音频进行声音信号放大,波动幅度低于50%的音频信号进行削弱。

5.根据权利要求1所述的一种基于深度学习的视频智能分析系统,其特征在于:所述表情/行为分析模块作用是通过视觉算法,对人脸进行识别,对人脸的关键点进行标记,通过跟踪人的眼睛,嘴巴唇的动作来判断此时人物的情感状态,人脸关键点标记视觉算法使用DCNN算法,DCNN算法使用68个人脸关键点进行人脸面部特征的高精度定位,使用两个卷积神经网络对关键点定位跟踪,实时表情识别效果使用端到端的网络轻量级的网络MobileNetV2、YOLO_V3,YOLOV3算法对目标进行检测跟踪,MobileNetV2算法对视频中的人脸进行跟踪,并用矩形框实时监测人脸动态,行为分析使用光流网络对视频中的人物动作跟踪判断,光流网络调节不同光强下的图片分辨率。

6.根据权利要求1所述的一种基于深度学习的视频智能分析系统,其特征在于:所述语音处理模块是对传入的语音数据提取声音信号特征,并进行分析,使用逆快速傅里叶变换提取音频特征,将提取到的特征放到深度学习网络中进行训练、学习、验证、测试,训练好模型后直接对音频数据进行分析,深度学习网络使用LSTM网络,LSTM网络对提取到的音频特征进行算法分析。

7.根据权利要求1所述的一种基于深度学习的视频智能分析系统,其特征在于:所述云端服务器模块包含GPU服务集群、英伟达显卡、机械硬盘、固态硬盘、水冷散热器件,所述GPU服务集群使用8块英伟达的Telsa V100显卡,所述机械硬盘采用2T的机械存储硬盘,所述处理器采用8块英特尔i9-9700k处理器,所述固态硬盘使用500G的三星固态硬盘,所述水冷散热器件使用氮化水冷散热器为服务器降温,所述GPU服务集群为深度学习和机器学习对大量音频数据视频数据训练时提供算力支持。

8.根据权利要求1所述的一种基于深度学习的视频智能分析系统,其特征在于:所述深度学习MobileNetV2算法,YOLOV3算法用来对视频中的人的表情和行为进行分析,并将学习到的特征进行表情分类,包括学生的喜怒哀乐,发呆,情感分析利用表情分类得出的结果对学生上课状态进行判断。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京睦泽信息科技有限公司,未经南京睦泽信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910490256.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top