[发明专利]一种用于会议系统的混音方法和系统有效
申请号: | 201910860802.2 | 申请日: | 2019-09-11 |
公开(公告)号: | CN110677208B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 周建明;康元勋;冯万健 | 申请(专利权)人: | 厦门亿联网络技术股份有限公司 |
主分类号: | H04H60/04 | 分类号: | H04H60/04;G10L21/0208;G10L21/0272 |
代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 陈远洋 |
地址: | 361000 福建省厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 会议系统 方法 系统 | ||
1.一种用于会议系统的混音方法,其特征在于,包括以下步骤:
S1:响应于检测到各成员的语音信号,计算所述各成员语音输入端的所述语音信号的语音能量;
S2:基于所述语音能量与预设的第一门限值,将所有成员划分为第一集合和第二集合,其中,将所述语音能量大于等于所述第一门限值的成员归集至所述第一集合中,所述语音能量小于所述第一门限值的成员归集至所述第二集合中;
S3:响应于动态分析的所述第二集合中语音能量最大值与所述第一集合中语音能量的最小值的差值大于等于预设的第二门限值,将所述第二集合中语音能量最大值的成员与所述第一集合中语音能量的最小值的成员交换,从而更新所述第一集合和所述第二集合,其中,所述第二集合中语音能量最大值与所述第一集合中语音能量的最小值的差值大于等于预设的第二门限值表示所述第二集合中语音能量最大值远大于所述第一集合中语音能量的最小值;
S4:将更新后的所述第一集合中的所述语音信号混音合成并输出;
其中,所述语音能量为当前语音帧的RMS值RMScur与历史语音帧的RMS值RMSi-1平滑获得的当前语音帧的最终语音能量RMSi,具体的计算公式为:RMSi=αRMScur+(1-α)RMSi-1,其中α表示平滑因子,i为当前语音帧的序号。
2.根据权利要求1所述的用于会议系统的混音方法,其特征在于,当前语音帧的RMS值RMScur具体计算公式为:其中x1,x2,...,xL表示当前语音帧包括的L个语音数据。
3.根据权利要求1所述的用于会议系统的混音方法,其特征在于,所述步骤S2中的第一门限值选自50-80dB的范围。
4.根据权利要求1所述的用于会议系统的混音方法,其特征在于,所述步骤S3还包括:
响应于动态分析的所述第二集合中语音能量最大值与所述第一集合中语音能量的最小值的差值小于所述第二门限值,且所述第二集合中语音能量最大值小于所述第一集合中语音能量的最小值,保持所述第一集合和所述第二集合中的成员不变;
若满足条件的连续帧数大于预设的帧数门限值,则将所述第二集合中语音能量最大值的成员与所述第一集合中语音能量的最小值的成员交换,所述条件为动态分析的所述第二集合中语音能量最大值与所述第一集合中语音能量的最小值的差值小于所述第二门限值,且所述第二集合中语音能量最大值大于所述第一集合中语音能量的最小值;
若满足所述条件的连续帧数小于预设的帧数门限值,则保持所述第一集合和所述第二集合的成员不变。
5.根据权利要求4所述的用于会议系统的混音方法,其特征在于,所述第二门限值选自3-6dB的范围。
6.根据权利要求4所述的用于会议系统的混音方法,其特征在于,所述帧数门限值选自4-6帧的范围。
7.根据权利要求1所述的用于会议系统的混音方法,其特征在于,所述步骤S4具体为:对于更新后的所述第一集合中的各语音输出端,输出除自身语音信号外的更新后的所述第一集合中的其他语音信号的混音信号;对于更新后的所述第二集合中的各语音输出端,输出更新后的所述第一集合中的所有语音信号的混音信号。
8.一种计算机可读存储介质,其上存储有一或多个计算机程序,其特征在于,该一或多个计算机程序被计算机处理器执行时实施权利要求1至7中任一项所述的方法。
9.一种用于会议系统的混音系统,其特征在于,所述系统包括:
能量计算模块:配置用于响应于检测到各成员的语音信号,计算各成员语音输入端的所述语音信号的语音能量;
分组模块:配置用于基于所述语音能量与预设的第一门限值,将所有成员划分为第一集合和第二集合,其中,将所述语音能量大于等于所述第一门限值的成员归集至所述第一集合中,所述语音能量小于所述第一门限值的成员归集至所述第二集合中;
动态更新模块:配置用于响应于动态分析的所述第二集合中语音能量最大值与所述第一集合中语音能量的最小值的差值大于预设的第二门限值,将所述第二集合中语音能量最大值的成员与所述第一集合中语音能量的最小值的成员交换,从而更新所述第一集合和所述第二集合,其中,所述第二集合中语音能量最大值与所述第一集合中语音能量的最小值的差值大于等于预设的第二门限值表示所述第二集合中语音能量最大值远大于所述第一集合中语音能量的最小值;
混音输出模块:配置用于将更新后的所述第一集合中的所述语音信号混音合成并输出;
其中,所述语音能量为当前语音帧的RMS值RMScur与历史语音帧的RMS值RMSi-1平滑获得的当前语音帧的最终语音能量RMSi,具体的计算公式为:RMSi=αRMScur+(1-α)RMSi-1,其中α表示平滑因子,i为当前语音帧的序号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门亿联网络技术股份有限公司,未经厦门亿联网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910860802.2/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类