[发明专利]一种音量的调节方法及系统有效
申请号: | 201811235944.1 | 申请日: | 2018-10-23 |
公开(公告)号: | CN109213471B | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 邱泽宇;李昂 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F3/16 | 分类号: | G06F3/16 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
地址: | 100080 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音量 调节 方法 系统 | ||
本发明公开了一种音量的调节方法及系统,从环境中采集音频信号后,将该音频信号分割成多个短时音频帧,当短时音频帧中的短时能量大于短时能量阈值,短时频率大于短时频率阈值时,判定相对应的短时音频帧处于语音混合状态,通过对所有处于语音混合状态的短时音频帧进行处理,将高于基准音频帧的短时音频帧调低至所述基准音频帧,将低于基准音频帧的短时音频帧调高至所述基准音频帧,实现对音量的自动调节。从而解决了语音互动时,产生音量大幅波动的问题,并省去了用户手动调节播放器的音量的过程,因此提高了语音互动体验,使用户可以进行正常的语音交流。
技术领域
本发明涉及语音调节技术领域,更具体的说,涉及一种音量的调节方法及系统。
背景技术
在多人语音实时互动,比如直播时,由于种种因素,如新的参与者加入、环境噪音以及设备问题,有时会发生音量突然变大或突然变小的情况,或是产生刺耳的噪声,俗称“炸麦”,因此会对正常的语音交流产生影响,进而还可能影响用户的其他行为,如直播和游戏。
当出现“炸麦”现象时,就需要用户手动调节播放器的音量,这对用户而言是极其不方便的,而现有的语音实时通信软件还无法避免“炸麦”现象。因此,如何提供一种音量的调节方法及系统,实现对音量的自动调节成为了本领域技术人员亟需解决的技术问题。
发明内容
有鉴于此,本发明公开一种音量的调节方法及系统,以解决语音互动时,产生音量大幅波动的问题,并省去用户手动调节播放器的音量的过程,因此提高了语音互动体验,使用户可以进行正常的语音交流。
一种音量的调节方法,包括:
采集环境中的音频信号;
将所述音频信号分割成多个短时音频帧,所述短时音频帧的短时特征包括:短时能量和短时频率;
判断所述短时能量是否大于短时能量阈值,且所述短时频率是否大于短时频率阈值;
如果是,则判定相对应的短时音频帧处于语音混合状态,所述语音混合状态包括:超过声音标准值的声音以及低于所述声音标准值的声音;
对所有处于语音混合状态的短时音频帧进行处理,将高于基准音频帧的短时音频帧调低至所述基准音频帧,将低于所述基准音频帧的短时音频帧调高至所述基准音频帧,实现对音量的自动调节。
优选的,所述对所有处于语音混合状态的短时音频帧进行处理,将高于基准音频帧的短时音频帧调低至所述基准音频帧,将低于所述基准音频帧的短时音频帧调高至所述基准音频帧,实现对音量进行自动调节,具体包括:
每检测到一个处于语音混合状态的短时音频帧,则对检测到的短时音频帧采用小波变换,得到来自不同用户的短时音频帧和环境噪声帧;
采用小波滤波方法对所述环境噪声帧进行滤除;
计算所有用户的短时音频帧在被检时刻的平均值;
当所述平均值与所述被检时刻的上一时刻的平均值的差值不在预设差值范围内时,则将所述被检时刻的平均值作为所述基准音频帧。
优选的,所述对所有处于语音混合状态的短时音频帧进行处理,将高于基准音频帧的短时音频帧调低至所述基准音频帧,将低于所述基准音频帧的短时音频帧调高至所述基准音频帧,实现对音量进行自动调节,具体包括:
连续检测N个处于语音混合状态的短时音频帧,对每个被检短时音频帧采用小波变换,得到每个所述被检短时音频帧中包含的来自不同用户的短时音频帧和环境噪声帧,N为大于1的正整数;
采用小波滤波方法对每个所述被检短时音频帧中包含的环境噪声帧进行滤除;
分别计算每个所述被检短时音频帧相对应的所有用户的短时音频帧在被检时刻的平均值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811235944.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于语音识别的光标控制方法
- 下一篇:用于利用常数值的矢量运算的指令