[发明专利]语音标注文本修正方法、计算机设备和存储介质有效
| 申请号: | 201810792037.0 | 申请日: | 2018-07-18 |
| 公开(公告)号: | CN110808049B | 公开(公告)日: | 2022-04-26 |
| 发明(设计)人: | 黄石磊;刘轶;程刚;王昕 | 申请(专利权)人: | 深圳市北科瑞声科技股份有限公司 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/06 |
| 代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
| 地址: | 518051 广东省深圳市南山区*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 标注 文本 修正 方法 计算机 设备 存储 介质 | ||
本申请涉及一种语音标注文本修正方法,包括:获取待检测文本中的已修正子文本;所述待检测文本为初始语音识别器识别语音得到的初始词图中分数最高的识别结果;基于所述已修正子文本的修正类型对初始语音识别器中的模型调整确定适应性模型;通过所述适应性模型确定适应性识别结果,根据所述适应性识别结果更新所述待检测文本中的未修正子文本的相关信息。通过上述方法,由于通过学习已修正子文本中的修正逻辑对语音识别器中的模型进行调整得到新的模型,未经过修正的部分可以通过新的模型得到新的识别结果,从而对于用户修正后续的标注文本可以减少一定的工作量,提高效率。
技术领域
本申请涉及语音识别技术领域,特别是涉及一种语音标注文本修正方法、计算机设备和存储介质。
背景技术
语音标注(Transcription),简单而言,就是把语音转换成文字,过程中可以分为粗标和精标。目前人工语音标注员基于语音识别进行校对,并利用大数据搜集和分析使语音识别更加精准。一方面,语音标注可以为语音识别或者其他语音应用领域提供基本的数据资源;另一方面,在实际系统中,完全依靠语音识别的结果总会有一定的错误,所以一定还需要人工进行校对和修改,而如何提高校改的速度也是需要解决的问题。建立正确率高的识别系统一般对应着大数据量的人工标注数据,因此存在效率低下问题。
发明内容
基于此,有必要针对语音标注文本修正的效率低下的问题,提供一种语音标注文本修正方法、计算机设备和存储介质。
一种语音标注文本修正方法,所述方法包括:
获取待检测文本中的已修正子文本;所述待检测文本为初始语音识别器识别语音得到的初始词图中分数最高的识别结果;
基于所述已修正子文本的修正类型对初始语音识别器中的模型调整确定适应性模型;
通过所述适应性模型确定适应性识别结果,根据所述适应性识别结果更新所述待检测文本中的未修正子文本的相关信息。
在其中一个实施例中,当所述已修正子文本的修正类型为同音修正时,基于所述已修正子文本的修正类型对初始语音识别器中的模型调整确定适应性模型包括:
根据所述已修正子文本和初始语音识别器中的初始语言模型、通过语言模型生成器确定适应性语言模型;
通过所述适应性模型确定适应性识别结果,根据所述适应性识别结果更新所述待检测文本中的未修正子文本包括:
通过所述适应性语言模型对所述未修正子文本对应的语音的初始词图重新计算,确定第一识别结果;根据所述第一识别结果更新所述未修正子文本的相关信息。
在其中一个实施例中,通过所述适应性语言模型对所述未修正子文本对应的语音的初始词图重新计算,确定第一识别结果包括:
对所述未修正子文本对应的语音的初始词图重新计算得到第一适应性词图,将所述第一适应性词图中分数最高的识别结果作为第一识别结果。
在其中一个实施例中,当所述修正文本的修正类型为不同音修正时,基于所述已修正子文本的修正类型对初始语音识别器中的模型调整确定适应性模型包括:
根据所述已修正子文本、已修正子文本修正前对应的文本和初始声学模型,通过声学模型自适应算法确定适应性声学模型;
通过所述适应性模型确定适应性识别结果,根据所述适应性识别结果更新所述待检测文本中的未修正子文本包括:
通过包含适应性声学模型的适应性语音识别器对所述未修正子文本对应的语音重新识别,确定第二识别结果;
根据所述第二识别结果更新所述未修正子文本的相关信息。
在其中一个实施例中,通过包含适应性声学模型的适应性语音识别器对所述未修正子文本对应的语音重新识别,确定第二识别结果包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市北科瑞声科技股份有限公司,未经深圳市北科瑞声科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810792037.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轮播图的优化方法及系统、电子设备
- 下一篇:一种一体式空调





