[发明专利]一种获取声卡和麦克风声音并进行混音的方法及系统在审

申请号：	201611092295.5	申请日：	2016-12-01
公开（公告）号：	CN106601263A	公开（公告）日：	2017-04-26
发明（设计）人：	杨亮	申请（专利权）人：	武汉斗鱼网络科技有限公司
主分类号：	G10L21/003	分类号：	G10L21/003
代理公司：	武汉智权专利代理事务所(特殊普通合伙)42225	代理人：	张凯
地址：	430000 湖北省武汉市武汉东湖***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种获取声卡麦克风声音进行方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及多媒体应用技术领域，具体涉及一种获取声卡和麦克风声音并进行混音的方法及系统。

背景技术

获取系统声卡和麦克风的声音是一个应用比较广泛的功能，最常见的有QQ的远程协助功能、一些监控软件以及一些直播软件、视频会议等，都会对系统声卡以及麦克风进行实时的声音采集，并利用相关的音频编码器对采集到的声卡和麦克风声音进行编码，然后利用网络进行传输。现在一般通过对采集到的声卡和麦克风声音直接线性叠加后求平均值的方法计算出混音后的音频数据。其缺点是对于原音频数据的衰减过大，影响声音质量。

同时，采用直接线性叠加后求平均值的方法在混音后只能输出固定频率的声音，而无法根据用户的需求调整声卡或麦克风的声音数据所占比例。

发明内容

针对现有技术中存在的缺陷，本发明的目的在于提供一种获取声卡和麦克风声音并进行混音的方法及系统，可获取声卡和麦克风声音并进行混音，保证混音后音频数据的声音质量且可根据用户需求调整混音输出属性。

为达到以上目的，本发明采取的技术方案是：

采集声卡和麦克风的音频数据，并使用该音频数据的声音位数表示其采样值，对采集到的音频数据的采样值进行数据归一化，并设置声卡混音权重和麦克风混音权重，所述声卡混音权重为声卡的音频数据占混音后的音频数据的比值，所述麦克风混音权重为麦克风的音频数据占混音后的音频数据的比值；根据声卡混音权重和麦克风混音权重计算出混音后的音频数据的采样值，根据混音后的音频数据的采样值输出混音后的音频数据。

在上述技术方案的基础上，混音后的音频数据的采样值＝声卡音频数据的采样值*声卡混音权重+麦克风音频数据的采样值*麦克风混音权重。

在上述技术方案的基础上，采集声卡音频数据和麦克风的音频数据的具体过程包括：

创建IMMDeviceEnumerator接口；

通过IMMDeviceEnumerator接口分别获取声卡和者麦克风对应的IMMDevice接口；

通过IMMDevice接口获取IAudioClient接口；

通过IAudioClient接口获取到IAudioCaptureClient接口；

实时监测声卡或麦克风中是否有数据；

监测到有数据时，调用通过IAudioCaptureClient接口获取声卡或麦克风中的声音数据。

在上述技术方案的基础上，将声卡混音权重和麦克风混音权重设置为等值，输出的混音中声卡的声音与麦克风的声音均匀输出。

在上述技术方案的基础上，设置声卡混音权重大于麦克风混音权重，输出的混音突出声卡的声音而抑制麦克风的声音。

在上述技术方案的基础上，设置声卡混音权重小于麦克风混音权重，输出的混音抑制声卡的声音而突出麦克风的声音。

在上述技术方案的基础上，声卡混音权重与麦克风混音权重之和为1。