[发明专利]一种实时语音分离语音转写的方法有效
申请号: | 202111548064.1 | 申请日: | 2021-12-17 |
公开(公告)号: | CN113936687B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 赵建平;荆榆;程栋梁;沈忱;石松涛;高博;许乾坤;张宇韬 | 申请(专利权)人: | 北京睿科伦智能科技有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L25/51;G10L15/26 |
代理公司: | 北京东灵通专利代理事务所(普通合伙) 61242 | 代理人: | 李金豹 |
地址: | 100089 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实时 语音 分离 转写 方法 | ||
本发明是一种实时语音分离语音转写的方法,包括:硬件采集模块,语音分离模块,语音转写模块,其中,硬件采集模块用来采集语音数字信号;语音分离模块用来对硬件采集模块的采集的不同方向语音数字信号分离;语音转写模块对所述语音分离模块分离出来的各路语音数字信号转写为文字,硬件采集模块的麦克风拾音模组采集语音信号,仅需配置角度参数;语音分离模块可实时、有效的将多人对话按说话人分离,进行实时语音转写;同时,语音分离模块可有效降低环境噪声的干扰,对固定方向的声源进行转写,从而可有效的分离重叠的对话语音,进行有效的语音转写。
技术领域
本发明涉及计算机领域,具体涉及一种实时语音分离语音转写的方法。
背景技术
在类似保险、银行柜台具有固定位置的服务对话场景中,需要在略微吵杂的环境中,对双方的对话进行有效的记录;
现有的桌面指向拾音产品,只能对其使用者,即使用人进行近场拾音,无法同时获得对话中对人的语音,若场景中存在多人说话,需布局多个近场的拾音设备,且离说话人非常近,通常在20公分以内。本方法可以通过放在桌面端的麦克风阵列拾音器,实时判断分离不同方向的多个人声,并实时按多个不同角色,输出为对应的文本信息,该方法可有效的应用于多人讲话、同时讲话、移动讲话的多种不同场景。
远场使用场景中,复杂的噪声环境严重影响了语音转写的正确率,本发明可有效抑制使用环境中的噪音影响,包含环境噪音和其他非目标说话人的声音。
远场多人对话场景中,受复杂的噪声的影响,且对话场景中抢话,插话导致连续语音中多人的话术,本发明可实时有效的分离对话场景的多说话人语音,进行有效转写。
发明内容
本发明提供一种实时语音分离语音转写的方法,通过硬件采集模块,得到多路麦克风的数字信号,经过语音分离模块对多说话人进行声源定位后对固定方向的声源成形,形成说话方向的滤波后的语音信号,进一步消除非目标方向的语音和干扰信号,然后语音转写模块把固定方向的语音信号转化为文字内容。
为了达到上述目的,本发明提供如下技术方案:一种实时语音分离语音转写的方法,包括:通过硬件采集模块对多人说话的声音采集,并得到多路麦克风的数字信号;
通过语音分离模块将所述数字信号分离出多个单人的语音信号;
将各个所述语音信号分别接入语音转写模块,转写成对应每个说话人的文字内容。
优选的,所述采集模块包含多个麦克风拾音模组;各个所述麦克风拾音模组的采样率为16kHz的数字信号。
优选的,所述语音分离模块由DOA声源定位、Fixed Beamformer固定方向波束成形,Post Filter后处理滤波器及Post Separator后处理时域分离器构成。
优选的,所述DOA声源定位采用GWS-SRP-PHAT方法:
第一步、先计算SRP-PHAT得到每一帧的原始DOA输出记为DOA_PEAK_RAW,同时对不同频率进行加权,用以平衡不同频率的空间谱分辨率和麦克风间距,提高DOA精度,按5度为间隔,扫描0-360度SRPout最大值为目前DOA_PEAK_energy和DOA_PEAK;
第二步、对DOA_PEAK进行中值滤波器平滑滤波得到DOA_SMOOTH,结合语音学和经验值设定,中值滤波器长度为H,当前时刻T,DOA_SMOOTH为中值滤波器的输出,即窗口H内排序后的中值DOA_SMOOTH;
第三步、为按指定的目标方向角DOA_TARGET和波束范围DOA_BEAM,得到FixedBeamformer的输入导向矢量DOA_TARGET_BF,同时输出平滑DOA_SMOOTH。
优选的,所述Fixed Beamformer固定方向波束成形通过采用Modified TF-GSC结构分别输出目标说话方向空间滤波后的语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京睿科伦智能科技有限公司,未经北京睿科伦智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111548064.1/2.html,转载请声明来源钻瓜专利网。