[发明专利]一种多人发言场景的语音识别方法和系统有效
申请号: | 201910803504.X | 申请日: | 2019-08-28 |
公开(公告)号: | CN110580907B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 何世阳;王善彬 | 申请(专利权)人: | 云知声智能科技股份有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/28;G10L25/51 |
代理公司: | 北京冠和权律师事务所 11399 | 代理人: | 张楠楠 |
地址: | 100000 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种多人发言场景的语音识别方法和系统,该多人发言场景的语音识别方法和系统不仅能够在多人发言场景中顺序地接收和识别语音信号,并且还能够在该多人发言场景中对每一个语音信号进行语音采集时间戳的识别从而有效地克服了原有的语音识别技术无法正确地还原不同发言端的发言顺序的缺陷;此外,方法和系统还能够准确地还原不同发言端之间的发言顺序以保证最终语音识别文本的准确性,以及节省后续语音识别结果整理的时间和提高语音识别的效率。 | ||
搜索关键词: | 一种 发言 场景 语音 识别 方法 系统 | ||
【主权项】:
1.一种多人发言场景的语音识别方法,其特征在于,所述多人发言场景的语音识别方法包括如下步骤:/n步骤(1),在多个预设识别周期中的每一个周期内,对若干发言端中的每一个各自的语音信号及其语音采集时间戳进行识别处理;/n步骤(2),将每一个周期内所述识别处理的结果转换成若干文本格式信息,并将所述若干文本格式信息进行顺序缓存处理;/n步骤(3),对所述顺序缓存处理得到的缓存队列进行关于发言端身份切换与否的判断处理,以此获得所述缓存队列中所有语音信号的语音识别结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司,未经云知声智能科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910803504.X/,转载请声明来源钻瓜专利网。