[发明专利]用于文本后处理的方法、装置、电子设备和介质在审
| 申请号: | 202011239259.3 | 申请日: | 2020-11-09 |
| 公开(公告)号: | CN112509562A | 公开(公告)日: | 2021-03-16 |
| 发明(设计)人: | 姚佳立;高晓 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22;G10L15/26 |
| 代理公司: | 北京海智友知识产权代理事务所(普通合伙) 11455 | 代理人: | 吴京顺 |
| 地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 文本 处理 方法 装置 电子设备 介质 | ||
本公开的实施例公开了用于文本后处理的方法、装置、电子设备和介质。该方法的一具体实施方式包括:获取至少两个与待识别语音匹配的预测文本;对该至少两个预测文本进行多任务文本后处理,生成与该待识别语音对应的识别文本,其中,该多任务文本后处理包括以下至少两项子任务:文本纠错,标点预测,逆文本标准化。该实施方式可以降低后处理流程的复杂程度,减少错误累积,从而提升后处理各个子任务的效果。
技术领域
本公开的实施例涉及计算机技术领域,具体涉及用于文本后处理的方法、装置、电子设备和介质。
背景技术
自动语音识别技术(Automatic Speech Recognition,ASR)通常包含以下几个模块:声学特征抽取,声学模型训练,解码和后处理。其中,声学特征抽取是将语音这种波形信号经过傅立叶变换等方式转换成Filter-bank特征或者MFCC特征等音频特征;声学模型训练是将音频特征映射为对应的声学状态;解码是将声学状态映射为人能够阅读和理解的文字;后处理是对识别出的文字进行进一步处理,提高可阅读性和可理解性。
现有语音识别后处理流程通常为流水线(pipeline)结构,往往需要对待处理预测文本(hypothesis)依次进行标点标注、ITN(Inverse Text Normalization,逆文本标准化)、分句、纠错等处理,最终得到语音识别文本。
发明内容
本公开提出了用于文本后处理的方法、装置、电子设备和介质。
第一方面,本公开的实施例提供了一种用于文本后处理的方法,该方法包括:获取至少两个与待识别语音匹配的预测文本;对至少两个预测文本进行多任务文本后处理,生成与待识别语音对应的识别文本,其中,多任务文本后处理包括以下至少两项子任务:文本纠错,标点预测,逆文本标准化。
在一些实施例中,上述对至少两个预测文本进行多任务文本后处理,得到与待识别语音对应的识别文本,包括:将至少两个预测文本输入至预先训练的文本后处理模型,得到与待识别语音对应的识别文本,其中,文本后处理模型用于多任务文本后处理。
在一些实施例中,上述文本后处理模型中包括编码器和解码器,上述编码器中包括第一数目个子编码器和编码融合器,上述第一数目与至少两个预测文本的数目一致,上述编码融合器用于融合第一数目个子编码器输出的特征,以及将融合后的特征输入至解码器。
在一些实施例中,上述子编码器包括依次连接的第二数目个编码层,以及上述编码融合器用于融合上述第一数目个子编码器中最后一层编码层输出的特征,以及将融合后的特征输入至上述解码器。
在一些实施例中,上述解码器包括依次连接的第三数目个解码层,以及第三数目个解码层中的解码层用于执行多任务文本后处理的子任务。
在一些实施例中,上述依次连接的第三数目个解码层用于执行的多任务文本后处理的子任务依次包括以下至少两项:文本纠错,标点预测,逆文本标准化。
在一些实施例中,上述获取至少两个与待识别语音匹配的预测文本,包括:获取待识别语音;将待识别语音输入至预先训练的语音识别模型,得到第四数目个准预测文本和对应的置信度;根据第四数目个准预测文本对应的置信度,选取目标数目个准预测文本作为至少两个与待识别语音匹配的预测文本。
第二方面,本公开的实施例提供了一种用于训练文本后处理模型的方法,该方法包括:获取训练样本集合,其中,训练样本集合中的训练样本包括对应于同一样本语音的至少两个样本预测文本和对应的样本标注文本,样本标注文本中包括至少两项文本后处理子任务对应标签,文本后处理子任务包括:文本纠错,标点预测,逆文本标准化;获取初始文本后处理模型;将训练样本集合中对应于同一样本语音的至少两个样本预测文本输入至初始文本后处理模型,得到处理后文本对应的特征;根据预设的损失函数确定所得到处理后文本对应的特征与输入的至少两个样本预测文本对应的样本标注文本对应的特征之间的损失值;根据损失值,调整初始文本后处理模型的参数,训练得到文本后处理模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011239259.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:沙蜇触手大、小刺丝囊的分离与毒液提取方法
- 下一篇:一种尾矿库筑坝方法





