[发明专利]一种多媒体音量调节方法及系统在审
| 申请号: | 201710656251.9 | 申请日: | 2017-08-03 |
| 公开(公告)号: | CN107241643A | 公开(公告)日: | 2017-10-10 |
| 发明(设计)人: | 李孟歆;林佰凤;张锐;张颖;侯静 | 申请(专利权)人: | 沈阳建筑大学 |
| 主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N5/60;G06K9/62;G06K9/00;G06F3/01 |
| 代理公司: | 北京高沃律师事务所11569 | 代理人: | 王戈 |
| 地址: | 110000 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 多媒体 音量 调节 方法 系统 | ||
技术领域
本发明涉及智能控制领域,特别是涉及一种多媒体音量调节方法及系统。
背景技术
多媒体是多种媒体的综合,一般包括文本,声音和图像等多种媒体形式。目前对多媒体音量的控制常用的有两种方式:一是通过多媒体设备的音量按钮手动调节;二是通过遥控设备远程调节。相比于手动调节音量的方式,远程调节在一定程度上提高了便捷性。但是不同的多媒体设备需要特定的遥控设备才能进行操作,而且并不是所有的多媒体设备都可以采用遥控设备远程调节音量,例如,电脑的音量调节只能采用手动接触鼠标或键盘的机械交互模式;多媒体课堂中PowerPoint展示,可以利用遥控设备进行页面的遥控操作,但是对于视频的音量或者其他多媒体的音量,只能通过鼠标进行调节。因此,现有的多媒体音量调节方式便捷性低。
发明内容
本发明的目的是提供一种多媒体音量调节方法及系统,以提高多媒体音量调节的便捷性。
为实现上述目的,本发明提供了如下方案:
一种多媒体音量调节方法,所述方法包括:
获取用户手势的深度图像,所述深度图像包括所述用户手势中手部关节的空间坐标;
对所述深度图像进行手部目标区域的图像分割,获得分割后的目标区域图像;
根据所述目标区域图像,利用Sobel算子进行手势边缘轮廓检测,提取边缘参数特征;
根据所述边缘参数特征利用DAG-SVMs分类器获得手势分类结果;
根据所述手势分类结果调节多媒体的音量级别,不同的手势分类对应不同的音量级别。
可选的,所述获取用户手势的深度图像,具体包括:
根据用户手势,利用Kinect摄像机获取所述用户手势的深度图像。
可选的,所述对所述深度图像进行手部目标区域的图像分割,具体包括:
根据所述深度图像绘制图像深度直方图;
根据所述直方图中深度值波谷确定多个待定阈值区间;
利用Kinect骨骼追踪技术确定最终阈值区间;
根据所述最终阈值区间进行手部目标区域的图像分割,获得分割后的目标区域图像。
可选的,所述对所述深度图像进行手部目标区域的图像分割之前,还包括:
对所述深度图像进行二值化处理,获得处理后的深度图像。
可选的,所述边缘参数特征包括边缘参数特征Hu矩和轮廓边缘参数特征长度矩,其中,
利用Hu矩与长度矩的手势边缘特征作为数字手势图像的特征,提取边缘参数特征Hu矩和轮廓边缘参数特征长度矩。
一种多媒体音量调节系统,所述系统包括:
深度图像获取模块,用于获取用户手势的深度图像,所述深度图像包括所述用户手势中手部关节的空间坐标;
图像分割模块,用于对所述深度图像进行手部目标区域的图像分割,获得分割后的目标区域图像;
边缘参数特征提取模块,用于根据所述目标区域图像,利用Sobel算子进行手势边缘轮廓检测,提取边缘参数特征;
手势分类结果获取模块,用于根据所述边缘参数特征利用DAG-SVMs分类器获得手势分类结果;
音量调节模块,用于根据所述手势分类结果调节多媒体的音量级别,不同的手势分类对应不同的音量级别。
可选的,所述深度图像获取模块为Kinect摄像机,用于根据镜头前的用户手势,获取所述用户手势的深度图像。
可选的,所述图像分割模块,具体包括:
直方图绘制单元,用于根据所述深度图像绘制图像深度直方图;
待定阈值区间确定单元,用于根据所述直方图中深度值波谷确定多个待定阈值区间;
最终阈值区间确定单元,用于利用Kinect骨骼追踪技术确定最终阈值区间;
图形分割单元,用于根据所述最终阈值区间进行手部目标区域的图像分割,获得分割后的目标区域图像。
可选的,所述系统还包括:
二值化处理模块,用于对所述深度图像进行手部目标区域的图像分割之前,对所述深度图像进行二值化处理,获得处理后的深度图像。
可选的,所述边缘参数特征包括边缘参数特征Hu矩和轮廓边缘参数特征长度矩,所述边缘参数特征提取模块用于利用Hu矩与长度矩的手势边缘特征作为数字手势图像的特征,提取边缘参数特征Hu矩和轮廓边缘参数特征长度矩。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳建筑大学,未经沈阳建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710656251.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种播放方法及终端
- 下一篇:多媒体视频的编辑方法及装置





