[发明专利]一种调整多媒体环境的方法、装置及存储设备有效
| 申请号: | 201811346948.7 | 申请日: | 2018-11-13 |
| 公开(公告)号: | CN109522425B | 公开(公告)日: | 2022-01-04 |
| 发明(设计)人: | 薄海硕;顾嘉唯 | 申请(专利权)人: | 北京物灵智能科技有限公司 |
| 主分类号: | G06F16/41 | 分类号: | G06F16/41 |
| 代理公司: | 北京晋德允升知识产权代理有限公司 11623 | 代理人: | 王戈 |
| 地址: | 100102 北京市朝阳区望京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 调整 多媒体 环境 方法 装置 存储 设备 | ||
本申请公开了一种调整多媒体环境的方法、装置及存储设备,该方法包括:检测环境音,输出特征值;根据所述特征值调整音轨音量和/或灯效。本申请能够取得的有益效果在于,营造一整套声光一体化的氛围,具有实时性,动态变化性,交互性,充分为产品的灵动性和拟人性增分。
技术领域
本申请涉及人工智能技术领域,尤其是涉及一种调整多媒体环境的方法、装置及存储设备。
背景技术
深度神经网络(Deep neural network,DNN)在各行各业应用越来越广泛。随着人们生活质量的提高,对影音类产品的要求也越来越高。人们在享受影音类产品的时候,环境中的各种声音会影响到人们的视听感受。单纯的灯光效果与声音变幻已经满足不了人们对视听的享受。现有技术还不能结合声音和灯光营造声光一体化的氛围。
发明内容
本申请实施例提供一种调整多媒体环境的方法、装置及存储设备。解决了不能结合声音和灯光营造声光一体化的氛围问题。
本申请实施例提供了一种调整多媒体环境的方法,该方法包括:
检测环境音,输出特征值;
根据所述特征值调整音轨音量和/或灯效。
进一步地,所述根据所述特征值调整音轨音量和/或灯效包括:
根据所述特征值,将所述环境音分为噪音和特定音频;
根据所述特定音频对应的特征值调整音轨音量和/或灯效。
进一步地,所述特征值的参数包括:音量值、时域信号相位幅值和时频信号谐波能量。
进一步地,所述根据所述特定音频对应的特征值调整音轨音量和/或灯效包括:
以音量值、时域信号相位幅值和时频信号谐波能量中的一者为索引对特征值按照从大到小排序;
根据排序后的特征值中作为索引的音量值、时域信号相位幅值或时频信号谐波能量的最大值对应的特征值调整音轨音量和/或灯效。
进一步地,所述根据排序后的特征值中作为索引的音量值、时域信号相位幅值或时频信号谐波能量的最大值对应的特征值调整音轨音量和/或灯效还包括:
在作为索引的音量值、时域信号相位幅值或时频信号谐波能量的最大值多于一个的情况下,比较未作为索引的特征值的参数中的一者,选择该未作为索引的特征值的参数中的一者的最大值对应的特征值调整音轨音量和/或灯效;
在该未作为索引的特征值的参数中的一者的最大值多于一个的情况下,比较未作为索引的特征值的参数中的另一者,选择该未作为索引的特征值的参数中的另一者的最大值对应的特征值调整音轨音量和/或灯效。
进一步地,所述根据排序后的特征值中作为索引的音量值、时域信号相位幅值或时频信号谐波能量的最大值对应的特征值调整音轨音量和/或灯效还包括:
在排序后的特征值中作为索引的音量值、时域信号相位幅值或时频信号谐波能量的最大值对应的特征值参数达到对应的预设阈值的情况下,调整音轨音量和/或灯效。
进一步地,所述调整音轨音量包括:
调整不同音轨之间的音量比例关系。
进一步地,所述调整灯效包括:
调用预设的灯光控制协议,展示灯效。
本申请实施例还提供了一种存储设备,其上存储有程序数据,所述程序数据用于被处理器执行时实现上述的调整多媒体环境的方法。
本申请实施例还提供了一种调整多媒体环境的装置,该装置包括:
存储设备,用于存储程序数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京物灵智能科技有限公司,未经北京物灵智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811346948.7/2.html,转载请声明来源钻瓜专利网。





