[发明专利]一种多媒体音量调节方法及系统在审
| 申请号: | 201710656251.9 | 申请日: | 2017-08-03 |
| 公开(公告)号: | CN107241643A | 公开(公告)日: | 2017-10-10 |
| 发明(设计)人: | 李孟歆;林佰凤;张锐;张颖;侯静 | 申请(专利权)人: | 沈阳建筑大学 |
| 主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N5/60;G06K9/62;G06K9/00;G06F3/01 |
| 代理公司: | 北京高沃律师事务所11569 | 代理人: | 王戈 |
| 地址: | 110000 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 多媒体 音量 调节 方法 系统 | ||
1.一种多媒体音量调节方法,其特征在于,所述方法包括:
获取用户手势的深度图像,所述深度图像包括所述用户手势中手部关节的空间坐标;
对所述深度图像进行手部目标区域的图像分割,获得分割后的目标区域图像;
根据所述目标区域图像,利用Sobel算子进行手势边缘轮廓检测,提取边缘参数特征;
根据所述边缘参数特征利用DAG-SVMs分类器获得手势分类结果;
根据所述手势分类结果调节多媒体的音量级别,不同的手势分类对应不同的音量级别。
2.根据权利要求1所述的方法,其特征在于,所述获取用户手势的深度图像,具体包括:
根据用户手势,利用Kinect摄像机获取所述用户手势的深度图像。
3.根据权利要求1所述的方法,其特征在于,所述对所述深度图像进行手部目标区域的图像分割,具体包括:
根据所述深度图像绘制图像深度直方图;
根据所述直方图中深度值波谷确定多个待定阈值区间;
利用Kinect骨骼追踪技术确定最终阈值区间;
根据所述最终阈值区间进行手部目标区域的图像分割,获得分割后的目标区域图像。
4.根据权利要求1所述的方法,其特征在于,所述对所述深度图像进行手部目标区域的图像分割之前,还包括:
对所述深度图像进行二值化处理,获得处理后的深度图像。
5.根据权利要求1所述的方法,其特征在于,所述边缘参数特征包括边缘参数特征Hu矩和轮廓边缘参数特征长度矩,其中,
利用Hu矩与长度矩的手势边缘特征作为数字手势图像的特征,提取边缘参数特征Hu矩和轮廓边缘参数特征长度矩。
6.一种多媒体音量调节系统,其特征在于,所述系统包括:
深度图像获取模块,用于获取用户手势的深度图像,所述深度图像包括所述用户手势中手部关节的空间坐标;
图像分割模块,用于对所述深度图像进行手部目标区域的图像分割,获得分割后的目标区域图像;
边缘参数特征提取模块,用于根据所述目标区域图像,利用Sobel算子进行手势边缘轮廓检测,提取边缘参数特征;
手势分类结果获取模块,用于根据所述边缘参数特征利用DAG-SVMs分类器获得手势分类结果;
音量调节模块,用于根据所述手势分类结果调节多媒体的音量级别,不同的手势分类对应不同的音量级别。
7.根据权利要求6所述的系统,其特征在于,所述深度图像获取模块为Kinect摄像机,用于根据镜头前的用户手势,获取所述用户手势的深度图像。
8.根据权利要求6所述的系统,其特征在于,所述图像分割模块,具体包括:
直方图绘制单元,用于根据所述深度图像绘制图像深度直方图;
待定阈值区间确定单元,用于根据所述直方图中深度值波谷确定多个待定阈值区间;
最终阈值区间确定单元,用于利用Kinect骨骼追踪技术确定最终阈值区间;
图形分割单元,用于根据所述最终阈值区间进行手部目标区域的图像分割,获得分割后的目标区域图像。
9.根据权利要求6所述的系统,其特征在于,所述系统还包括:
二值化处理模块,用于对所述深度图像进行手部目标区域的图像分割之前,对所述深度图像进行二值化处理,获得处理后的深度图像。
10.根据权利要求6所述的系统,其特征在于,所述边缘参数特征包括边缘参数特征Hu矩和轮廓边缘参数特征长度矩,所述边缘参数特征提取模块用于利用Hu矩与长度矩的手势边缘特征作为数字手势图像的特征,提取边缘参数特征Hu矩和轮廓边缘参数特征长度矩。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳建筑大学,未经沈阳建筑大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710656251.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种播放方法及终端
- 下一篇:多媒体视频的编辑方法及装置





