[发明专利]一种获取声卡和麦克风声音并进行混音的方法及系统在审
申请号: | 201611092295.5 | 申请日: | 2016-12-01 |
公开(公告)号: | CN106601263A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 杨亮 | 申请(专利权)人: | 武汉斗鱼网络科技有限公司 |
主分类号: | G10L21/003 | 分类号: | G10L21/003 |
代理公司: | 武汉智权专利代理事务所(特殊普通合伙)42225 | 代理人: | 张凯 |
地址: | 430000 湖北省武汉市武汉东湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 声卡 麦克风 声音 进行 方法 系统 | ||
技术领域
本发明涉及多媒体应用技术领域,具体涉及一种获取声卡和麦克风声音并进行混音的方法及系统。
背景技术
获取系统声卡和麦克风的声音是一个应用比较广泛的功能,最常见的有QQ的远程协助功能、一些监控软件以及一些直播软件、视频会议等,都会对系统声卡以及麦克风进行实时的声音采集,并利用相关的音频编码器对采集到的声卡和麦克风声音进行编码,然后利用网络进行传输。现在一般通过对采集到的声卡和麦克风声音直接线性叠加后求平均值的方法计算出混音后的音频数据。其缺点是对于原音频数据的衰减过大,影响声音质量。
同时,采用直接线性叠加后求平均值的方法在混音后只能输出固定频率的声音,而无法根据用户的需求调整声卡或麦克风的声音数据所占比例。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种获取声卡和麦克风声音并进行混音的方法及系统,可获取声卡和麦克风声音并进行混音,保证混音后音频数据的声音质量且可根据用户需求调整混音输出属性。
为达到以上目的,本发明采取的技术方案是:
采集声卡和麦克风的音频数据,并使用该音频数据的声音位数表示其采样值,对采集到的音频数据的采样值进行数据归一化,并设置声卡混音权重和麦克风混音权重,所述声卡混音权重为声卡的音频数据占混音后的音频数据的比值,所述麦克风混音权重为麦克风的音频数据占混音后的音频数据的比值;根据声卡混音权重和麦克风混音权重计算出混音后的音频数据的采样值,根据混音后的音频数据的采样值输出混音后的音频数据。
在上述技术方案的基础上,混音后的音频数据的采样值=声卡音频数据的采样值*声卡混音权重+麦克风音频数据的采样值*麦克风混音权重。
在上述技术方案的基础上,采集声卡音频数据和麦克风的音频数据的具体过程包括:
创建IMMDeviceEnumerator接口;
通过IMMDeviceEnumerator接口分别获取声卡和者麦克风对应的IMMDevice接口;
通过IMMDevice接口获取IAudioClient接口;
通过IAudioClient接口获取到IAudioCaptureClient接口;
实时监测声卡或麦克风中是否有数据;
监测到有数据时,调用通过IAudioCaptureClient接口获取声卡或麦克风中的声音数据。
在上述技术方案的基础上,将声卡混音权重和麦克风混音权重设置为等值,输出的混音中声卡的声音与麦克风的声音均匀输出。
在上述技术方案的基础上,设置声卡混音权重大于麦克风混音权重,输出的混音突出声卡的声音而抑制麦克风的声音。
在上述技术方案的基础上,设置声卡混音权重小于麦克风混音权重,输出的混音抑制声卡的声音而突出麦克风的声音。
在上述技术方案的基础上,声卡混音权重与麦克风混音权重之和为1。
在上述技术方案的基础上,将全部采集到的音频数据的采样值归一化到[-1,1]范围内。
在上述技术方案的基础上,混音后的音频数据的采样值大于1时,将混音后的音频数据的采样值算为1;混音后的音频数据的采样值小于-1时,将混音后的音频数据的采样值算为-1。
本发明还公开了一种获取声卡和麦克风声音并进行混音的系统,包括:
音频获取模块,用于采集声卡音频数据和麦克风的音频数据;
归一处理模块,用于使用采集到的音频数据的声音位数表示其采样值,对全部采集到的音频数据的采样值进行数据归一化;
混音处理模块,用于设置声卡混音权重和麦克风混音权重;根据声卡混音权重和麦克风混音权重计算出混音后的音频数据的采样值;根据混音后的音频数据的采样值输出混音后的音频数据。
与现有技术相比,本发明的优点在于:
(1)本发明采集声卡和麦克风的音频数据并对全部采集到的音频数据的采样值进行数据归一化,再根据用户需求设置声卡混音权重和麦克风混音权重,计算出混音后的音频数据的数值。采用归一化算法与直接求平均值的算法相比声音保真度更佳,可保证混音后音频数据的声音质量;同时可根据用户需求调整混音输出属性。
(2)本发明在混音后的音频数据的采样值大于1时,将混音后的音频数据的采样值算为1;在混音后的音频数据的采样值小于-1时,将混音后的音频数据的采样值算为-1,从而实现对混音后的音频数据的数据溢出的处理,避免混音后的音频数据的上溢出和下溢出,避免出现溢出的干扰噪音。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉斗鱼网络科技有限公司,未经武汉斗鱼网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611092295.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高清蓝牙音频收发终端及通信系统
- 下一篇:一种语音会议混音系统及方法