[发明专利]一种基于时序马尔科夫过程的自适应音量优化方法在审
| 申请号: | 202111654467.4 | 申请日: | 2021-12-30 |
| 公开(公告)号: | CN114613388A | 公开(公告)日: | 2022-06-10 |
| 发明(设计)人: | 麦联韬;唐海江;朱宇;袁宇豪 | 申请(专利权)人: | 杭州云嘉云计算有限公司 |
| 主分类号: | G10L21/034 | 分类号: | G10L21/034;G10L21/0208 |
| 代理公司: | 杭州杭诚专利事务所有限公司 33109 | 代理人: | 尉伟敏 |
| 地址: | 311100 浙江省杭州市余*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 时序 马尔科夫 过程 自适应 音量 优化 方法 | ||
本发明公开了一种基于时序马尔科夫过程的自适应音量优化方法,包括以下步骤:设置多个声音采集单元和图像采集单元,进行不同音源信号采集;对采集到的音源信号进行特征提取并将声音提供者与音源信号进行匹配;将音源信号进行自适应音源增益、噪音识别和串音识别;将优化后的音源信号进行音源输出;本发明通过自适应音源增益、噪音识别和串音识别实现准确的音源识别,实时分析各通道的音源音量,判断出保持理想识别效果的音量增益参数,实时分析多路通道的声学信息,判断各通道是否存有干扰语音,并进行相应的防串音抑制,提高声音识别率,对于硬件要求低,不受周围环境影响,解决了声音小的音源丢失和各通道串音问题,有效提升语音识别效果。
技术领域
本发明涉及声音信号处理技术领域,尤其涉及一种基于时序马尔科夫过程的自适应音量优化方法。
背景技术
公共场所如广场、公共汽车站、地铁等具有人流量大、地域广等特点,且公共场所的安全防范一直受到各国政府和人民的广泛关注。目前以视频监控为主的监控技术为公共场所的安全防范起到了积极的作用,然而视频监控技术存在监控死角、阴雨天监控模糊等问题。众所周知,在异常事件发生时常常伴随着尖叫声、枪声、玻璃破碎声、爆炸声等异常声音,因此音频监控与视频监控的协作运行已经成为公共场所安全监控领域的发展方向。
而在进行以语音识别为基础的多人实录系统中,室内环境结构、麦克风硬件、说话人位置和声音,都显著影响现场识别效果,各因素的变动容易造成收音微弱、麦克风串音,进而导致明显的识别率下降和识别结果错误等。
例如,中国专利CN202010825664.7公开了声音优化方法及声音优化系统。系统能够根据客户属性为其配置相应的声音优化模式,将人工坐席或语音机器人的音色音调转换为目标优化模式,提升客户体验;但是对于音源的识别效率并没有有效改进。
发明内容
本发明主要解决现有的技术中多音源识别效率低的问题;提供一种基于时序马尔科夫过程的自适应音量优化方法。
本发明的上述技术问题主要是通过下述技术方案得以解决的:一种基于时序马尔科夫过程的自适应音量优化方法,包括以下步骤:设置多个声音采集单元和图像采集单元,进行不同音源信号采集;对采集到的音源信号进行特征提取并将声音提供者与音源信号进行匹配;将音源信号进行自适应音源增益、噪音识别和串音识别;将优化后的音源信号进行音源输出。通过自适应音源增益、噪音识别和串音识别实现准确的音源识别,实时分析各通道的音源音量,判断出保持理想识别效果的音量增益参数,实时分析多路通道的声学信息,判断各通道是否存有干扰语音,并进行相应的防串音抑制,提高声音识别率,对于硬件要求低,不受周围环境影响,极大程度上解决了声音小的音源丢失和各通道串音问题,有效提升语音识别效果。
作为优选,所述的声音采集单元为相互之间距离小于1m的多个有线麦克风或相互之间距离大于5m的多个无线麦克风。降低无线传输造成的音源接收干扰。
作为优选,音源信号采集的方法为:在同一时间帧内将全部通道的音源信号进行汇集。降低音源采集对于硬件的要求,减少成本。
作为优选,所述的音源增益的方法为:获取当前帧某一音源通道内的音源信号,并获取该帧音源信号声音提供者K帧历史帧信号,将K+1帧音源信号输入前馈记忆网络得到增益后的音源信号。
作为优选,所述的串音识别的方法为:对各通道的特征数据进行相似度计算,对相似度高的通道,再通过时序马尔可夫过程进行数字信号的时序对齐,识别出在时间上有向后延迟的相似通道,将识别出的时间上有向后延迟的相似通道判定为串音通道。
作为优选,取每个通道在当前时间的特征和历史时间帧上的特征进行异常检测,识别出麦克风突然采集声音的过程,并计算该过程是串音发生的概率,将串音发生概率和串音通道判定结果进行加权计算,得到最终的串音识别结果。
作为优选,前馈记忆网络的损失函数为二元逻辑损失函数。通过二元逻辑损失函数进行样本调整,实现前馈记忆网络的参数调整。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州云嘉云计算有限公司,未经杭州云嘉云计算有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111654467.4/2.html,转载请声明来源钻瓜专利网。





