[发明专利]会议语音实时转写方法及系统有效
| 申请号: | 201911104871.7 | 申请日: | 2019-11-13 |
| 公开(公告)号: | CN110797043B | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 何赛娟;张华兵;周强 | 申请(专利权)人: | 思必驰科技股份有限公司 |
| 主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0272;G10L21/0364;G10L15/22 |
| 代理公司: | 北京商专永信知识产权代理事务所(普通合伙) 11400 | 代理人: | 黄谦;车江华 |
| 地址: | 215123 江苏省苏州市苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 会议 语音 实时 转写 方法 系统 | ||
本发明实施例提供一种会议语音实时转写方法。该方法包括:接收多个麦克风阵列所采集的语音信号;对麦克风阵列采集的语音信号进行差分处理;通过盲源分离对差分处理后的语音信号进行处理,提取出语音信号中说话的参会人员各自的语音信号;根据盲源分离后的语音信号进行位置估计,确定出说话的参会人员各自所在的参会区域;对确定出说话的参会区域的语音信号进行语音识别,实时转化成对应的文字。本发明实施例还提供一种会议语音实时转写系统。本发明实施例在会议场景中配置好对应的麦克风集群,提升采集语音的信噪比。有效为各麦克风集群确定各自的识别区域,更加适用于多人同时说话的会议中的语音识别实时转写。
技术领域
本发明涉及智能语音领域,尤其涉及一种会议语音实时转写方法及系统。
背景技术
在企业运作中,会议的召开十分普遍,当人们有问题需要解决,或需要作出权威的决定或决议时,一般都会开会。使参会人员了解到问题的重要性,确定出对应的方案后进行执行。为了保障后续对会议内容的查阅,通常会进行会议记录。
在会议记录中,人工记录比较费劲,并且可能会遗漏会议中的某些要点,或不自主的掺杂一些个人的观点,使得会议记录不准确。随着智能语音的发展,如今会使用语音识别技术,来获取会议中发言人的语音,进行识别转写,得到会议记录。
在实现本发明过程中,发明人发现相关技术中至少存在如下问题:
由于参会人员众多,环境较为嘈杂,影响了语音识别的效果,并且并不是每个参会人员都会距离麦克风较近。对于距离麦克风较远的参会人员发言时,识别率就会进一步下降。如果会议中多人同时说话,那就严重影响了识别转写效果,无法进行记录。
发明内容
为了至少解决现有技术中嘈杂环境、麦克风与发言人较远、多人同时说话时影响会议记录的识别转写的问题。
第一方面,本发明实施例提供一种会议语音实时转写方法,应用于由多个麦克风阵列组成的麦克风集群,包括:
接收多个麦克风阵列所采集的语音信号,其中,所述多个麦克风阵列分别配置在各自的参会区域中;
对所述麦克风阵列采集的语音信号进行差分处理,以增强所述麦克风阵列中与说话的参会人员方向对应麦克风的语音信号;
通过盲源分离对差分处理后的语音信号进行处理,提取出语音信号中所述说话的参会人员各自的语音信号;
根据盲源分离后的语音信号进行位置估计,确定出所述说话的参会人员各自所在的参会区域;
对确定出说话的参会区域的语音信号进行语音识别,实时转化成对应的文字。
第二方面,本发明实施例提供一种会议语音实时转写系统,应用于由多个麦克风阵列组成的麦克风集群,包括:
信号采集程序模块,用于接收多个麦克风阵列所采集的语音信号,其中,所述多个麦克风阵列分别配置在各自的参会区域中;
信号增强程序模块,用于对所述麦克风阵列采集的语音信号进行差分处理,以增强所述麦克风阵列中与说话的参会人员方向对应麦克风的语音信号;
信号分离程序模块,用于通过盲源分离对差分处理后的语音信号进行处理,提取出语音信号中所述说话的参会人员各自的语音信号;
区域划分程序模块,用于根据盲源分离后的语音信号进行位置估计,确定出所述说话的参会人员各自所在的参会区域;
识别转写程序模块,用于对确定出说话的参会区域的语音信号进行语音识别,实时转化成对应的文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司,未经思必驰科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911104871.7/2.html,转载请声明来源钻瓜专利网。





