[发明专利]音量调整方法及装置、存储介质、电子设备有效

申请号：	201810096032.4	申请日：	2018-01-31
公开（公告）号：	CN108391162B	公开（公告）日：	2021-12-03
发明（设计）人：	花群;吴子扬;舒翔;严亚路	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	H04N21/439	分类号：	H04N21/439;H04N21/442
代理公司：	北京维澳专利代理有限公司 11252	代理人：	王立民
地址：	230000 安徽省***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	音量调整方法装置存储介质电子设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种音量调整方法，其特征在于，所述方法包括：

获取至少两张观影图像，分别从每张观影图像中截取出人体图像区域；

利用各人体图像区域分析用户的当前行为动作，包括：当观影图像中有至少两名用户时，分别获得各用户的动作区域响应图，并判断各动作区域响应图中响应区域的面积与预设面积是否相符，如果相符则保留该响应区域所属的动作区域响应图，并根据所保留的动作区域响应图中的响应区域分析当前行为动作；所述当前行为动作用于表示用户的当前观影状态，所述动作区域响应图用于标识发生动作变化的区域；

当所述当前行为动作相对上次行为动作发生变化时，根据所述变化进行音量调整。

2.根据权利要求1所述的方法，其特征在于，所述行为动作包括整体行为动作和/或局部行为动作，所述整体行为动作包括站立、坐姿、躺卧中的至少一种，所述局部行为动作包括四肢动作、头部动作、眼部动作中的至少一种。

3.根据权利要求1所述的方法，其特征在于，所述利用各人体图像区域分析用户的当前行为动作，包括：

将所述人体图像区域作为输入，经预先构建的动作响应模型处理后，输出用户的动作区域响应图；

划分所述动作区域响应图中的响应区域，将响应值不低于预设值的响应区域确定为待识别区域，所述响应值用于表示动作变化的幅度；

将所述待识别区域作为输入，经预先构建的动作分类模型处理后，输出所述待识别区域表示的当前行为动作。

4.根据权利要求3所述的方法，其特征在于，所述将所述人体图像区域作为输入，包括：

将所述人体图像区域进行无损放大后，作为所述动作响应模型的输入。

5.根据权利要求3或4所述的方法，其特征在于，所述方法还包括：

如果仅保留一名用户的动作区域响应图，则将该动作区域响应图确定为当前动作区域响应图；

所述将响应值不低于预设值的响应区域确定为待识别区域，包括：将所述当前动作区域响应图中响应值不低于预设值的响应区域确定为待识别区域。

6.根据权利要求5所述的方法，其特征在于，如果保留至少两名用户的动作区域响应图，所述方法还包括：

获取每名用户的人体图像区域在所述观影图像中的位置，将靠近中心区域的用户确定为当前用户，将当前用户的动作区域响应图确定为当前动作区域响应图；

或者，

将响应值最大的响应区域所属的动作区域响应图，确定为当前动作区域响应图；

或者，

从每个保留的动作区域响应图中确定出各自的待识别区域，通过所述动作分类模型得到各待识别区域表示的行为动作，将优先级最高的行为动作确定为所述当前行为动作。

7.一种音量调整装置，其特征在于，所述装置包括：

人体图像区域截取模块，用于获取至少两张观影图像，分别从每张观影图像中截取出人体图像区域；

当前行为动作分析模块，利用各人体图像区域分析用户的当前行为动作，包括：当观影图像中有至少两名用户时，分别获得各用户的动作区域响应图，并判断各动作区域响应图中响应区域的面积与预设面积是否相符，如果相符则保留该响应区域所属的动作区域响应图，并根据所保留的动作区域响应图中的响应区域分析当前行为动作；所述当前行为动作用于表示用户的当前观影状态，所述动作区域响应图用于标识发生动作变化的区域；

音量调整模块，用于当所述当前行为动作相对上次行为动作发生变化时，根据所述变化进行音量调整。

8.根据权利要求7所述的装置，其特征在于，所述行为动作包括整体行为动作和/或局部行为动作，所述整体行为动作包括站立、坐姿、躺卧中的至少一种，所述局部行为动作包括四肢动作、头部动作、眼部动作中的至少一种。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司，未经科大讯飞股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810096032.4/1.html，转载请声明来源钻瓜专利网。

上一篇：一种跨平台无线投屏方法
下一篇：视频处理方法和装置、电子设备、计算机可读存储介质

同类专利

专利分类

H 电学

H04 电通信技术
H04N 图像通信，如电视
H04N21-00 可选的内容分发，例如交互式电视，VOD〔视频点播〕
H04N21-20 .专门适用于内容分发的专用服务器，例如：VOD服务器；其操作
H04N21-40 .专门适用于接收内容或者与内容交互的客户端设备，如STB[机顶盒]；相关操作
H04N21-60 .用于在服务器和客户端之间或者在远程客户端之间的视频分配的网络结构或者处理
H04N21-80 .通过内容产生器独立于分配过程实现的内容或附加数据的生成或处理；内容本身
H04N21-81 ..其单媒体部件

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]音量调整方法及装置、存储介质、电子设备有效

专利文献下载