[发明专利]使用辅助信号的音频装置的传输控制在审
| 申请号: | 201980046124.4 | 申请日: | 2019-07-10 |
| 公开(公告)号: | CN112384975A | 公开(公告)日: | 2021-02-19 |
| 发明(设计)人: | D·古纳万;G·N·迪金斯 | 申请(专利权)人: | 杜比实验室特许公司 |
| 主分类号: | G10L19/012 | 分类号: | G10L19/012 |
| 代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 陈甜甜 |
| 地址: | 美国加利*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 使用 辅助 信号 音频 装置 传输 控制 | ||
本发明涉及一种用于音频装置的传输控制的设备及方法。所述音频装置使用除了麦克风之外的源确定妨害,且使用此计算增益以及作出传输决策。使用所述增益产生比使用所述传输决策本身更细微的妨害减轻。
本申请案主张2018年7月12日申请的第62/697,010号美国临时申请案及2018年7月12日申请的第18183034.0号欧洲专利申请案的优先权,所述申请案中的每一者以其全文引用的方式并入本文中。
背景技术
本发明涉及音频处理,且特定来说,涉及电信系统的传输控制。
除非本文中另外指示,否则本节中描述的方法不是本申请案中的权利要求的现有技术,且不因包含在本节中而被承认是现有技术。
语音活动检测(VAD)是用于确定在含有语音与噪声的混合的信号中存在语音的二元或概率指示符的技术。通常,语音活动检测的性能是基于分类或检测的精确度。研究工作受到将语音活动检测算法用于改进语音辨识的性能或用于控制在受益于不连续传输的方法的系统中传输信号的决策的激励。语音活动检测还用于控制信号处理功能,例如噪声估计、回声自适应及特定算法调谐,例如噪声抑制系统中的增益系数的滤波。
语音活动检测的输出可直接用于后续控制或元数据,及/或可用于控制对实时音频信号起作用的音频处理算法的性质。
语音活动检测的一种所关注的特定应用是在传输控制领域中。针对其中端点可在语音不活动周期期间停止传输或发送经减小数据速率信号的通信系统,语音活动检测器的设计及性能对系统的感知质量至关重要。此检测器最终必须作出二元决策,且遭遇根本问题,即,在可在短时间帧内观察到的许多特征中,为实现低延时,存在基本上重叠的语音及噪音的特性。因此,此检测器必须不断地在错误警报的普遍性与由于错误的决策而丢失期望的语音的可能性之间进行权衡。低延时、灵敏度及特异性的相反要求没有完全最佳的解决方案,或至少创建了其中系统的效率或最佳性取决于应用程序及预期输入信号的操作图景。
第2015/0032446号美国申请案公开案论述了一种组合短期语音活动检测与音频特征的较长期聚合以便作出传输控制决策的系统。
第2010/0145689号美国申请公开案论述了使用键击事件检测以及键击的听觉检测以便抑制语音片段期间的键击噪声。
发明内容
许多现存系统的一个问题是其主要考虑使用麦克风收集的声学信息。需要一种使用除了麦克风之外的组件检测妨害的系统。
许多现存系统的另一问题是其个别地考虑每一妨害事件以便减小听觉信号内的每一相应妨害事件的影响。需要一种聚合妨害事件以便作出更细微的妨害决策的系统。
考虑到上述问题及缺少解决方案,本文中描述的实施例涉及随着时间的推移聚合妨害事件及控制除了传输决策本身之外的传输的增益。
根据实施例,一种方法执行用于音频装置的传输控制。所述方法包含使用麦克风接收音频输入。所述方法进一步包含使用除了所述麦克风之外的源接收辅助输入。所述方法进一步包含对所述音频输入执行语音活动检测以产生语音活动置信级。所述方法进一步包含随着时间的推移聚合所述辅助输入以产生妨害级。所述方法进一步包含组合所述语音活动置信级与所述妨害级以产生传输决策级及增益级。
当所述传输决策级指示传输时,所述方法进一步包含:将所述增益级应用于所述音频输入以产生经修改音频输入;及传输所述经修改音频输入。
所述辅助输入可为多个辅助输入,且除了所述麦克风之外的所述源可为除了所述麦克风之外的多个源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杜比实验室特许公司,未经杜比实验室特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980046124.4/2.html,转载请声明来源钻瓜专利网。





