[发明专利]一种用于会议系统的混音方法和系统有效
申请号: | 201910860802.2 | 申请日: | 2019-09-11 |
公开(公告)号: | CN110677208B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 周建明;康元勋;冯万健 | 申请(专利权)人: | 厦门亿联网络技术股份有限公司 |
主分类号: | H04H60/04 | 分类号: | H04H60/04;G10L21/0208;G10L21/0272 |
代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 陈远洋 |
地址: | 361000 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 会议系统 方法 系统 | ||
本发明给出了一种用于会议系统的混音方法和系统,包括响应于检测到各成员的语音信号,计算各成员语音输入端语音信号的语音能量;基于语音能量与预设的第一门限值,将各成员划分为第一集合和第二集合,其中,将语音能量大于等于第一门限值的成员归集至第一集合中,语音能量小于第一门限值的成员归集至第二集合中;响应于第二集合中语音能量最大值与第一集合中语音能量的最小值的差值大于等于预设的第二门限值,将第二集合中语音能量最大值的成员与第一集合中语音能量的最小值的成员更换,并更新第一集合和第二集合;将第一集合中的语音信号混音合成并输出。基于动态分组保证输出有意义的语音信号,避免因噪音过多影响音频质量。
技术领域
本发明涉及计算机技术应用领域,尤其是一种用于会议系统的混音方法和系统。
背景技术
MCU的英文全称是multi control unit,多点控制单元。为了实现多点会议电视系统,必须设置MCU。MCU实质上是一台多媒体信息交换机,进行多点呼叫和连接,实现视频广播、视频选择、音频混合、数据广播等功能,完成各终端信号的汇接与切换。MCU与现行交换机不同之处在于,交换机完成的是信号的点对点连接,而MCU则要完成多点对多点的切换、汇接或广播。
随着网络通信技术的发展,多人语音系统的研究和应用已成为当前热点之一多人语音系统在人们的工作和娱乐中占有重要作用:例如进行网络会议时需要多人语音发言。多人语音系统最重要的技术之一是多级混音,主要是对多个来源的音频信号进行混音,每个音频信号占有一个通道。
对于常见的混音算法,在配置好混音路数之后,将所有配置好的音频数据全部进行混音,在背景噪声大的情况下,在混音路数超过一定数量时,混音效果很差,很难听得清发言内容。
发明内容
本发明提出了一种用于会议系统的混音方法和系统。
在一个方面,本发明提出了一种用于会议系统的混音方法,包括以下步骤:
S1:响应于检测到各成员的语音信号,计算各成员语音输入端语音信号的语音能量;
S2:基于语音能量与预设的第一门限值,将所有成员划分为第一集合和第二集合,其中,将语音能量大于等于第一门限值的成员归集至第一集合中,语音能量小于第一门限值的成员归集至第二集合中;
S3:响应于第二集合中语音能量最大值与第一集合中语音能量的最小值的差值大于等于预设的第二门限值,将第二集合中语音能量最大值的成员与第一集合中语音能量的最小值的成员交换,从而更新第一集合和第二集合;
S4:将更新后的第一集合中的语音信号混音合成并输出。
在具体的实施例中,步骤S1中语音能量用RMS值表示,当前语音帧的RMS值具体计算公式为:其中x1,x2,…,xL表示当前语音帧包括的L个语音数据。利用RMS值表示语音能量,可以将语音能量的值数值化,便于进行不同语音信号的比较。
在具体的实施例中,当前语音帧的RMS值RMScur与历史语音帧的RMS值RMSi-1平滑获得当前语音帧的最终语音能量RMSi,具体的计算公式为:RMSi=αRMScur+(1-α)RMSi-1,其中α表示平滑因子,i为当前语音帧的序号。利用当前语音帧与历史帧的平滑,获得相对准确的语音能量,提高基于语音信号分组相对精确性。
在优选的实施例中,步骤S2中的第一门限值选自50-80dB的范围。设置第一门限值有效的将语音信号划分为两个集合,便于最终的混音输出。
在具体的实施例中,步骤S3还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门亿联网络技术股份有限公司,未经厦门亿联网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910860802.2/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类