[发明专利]中文语音识别纠错方法、装置及电子设备在审
申请号: | 202110058472.2 | 申请日: | 2021-01-16 |
公开(公告)号: | CN114822519A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 尹旭贤 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L25/51 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 语音 识别 纠错 方法 装置 电子设备 | ||
1.一种中文语音识别纠错方法,其特征在于,所述方法包括:
获取语音数据的拼音信息和第一汉字信息;
融合所述拼音信息和所述第一汉字信息得到混合信息;
应用文本纠错模型对所述混合信息进行处理,得到第二汉字信息;
输出修正的语音识别结果;
其中,所述第二汉字信息包含有所述修正的语音识别结果;所述文本纠错模型为神经网络模型。
2.根据权利要求1所述的方法,其特征在于,所述拼音信息包含拼音概率,所述第一汉字信息包含汉字概率;
所述融合所述拼音信息和所述第一汉字信息得到所述混合信息,具体包括:
对所述拼音信息中的所述拼音概率和所述第一汉字信息中的所述汉字概率进行加权融合,得到包含多个子混合信息的所述混合信息。
3.根据权利要求2所述的方法,其特征在于,在对所述拼音信息中的所述拼音概率和所述第一汉字信息中的所述汉字概率进行所述加权融合之前,所述方法还包括:
在所述第一汉字信息中的所述汉字概率中,确定所述汉字概率小于阈值的汉字的位置,根据所述位置进行所述加权融合。
4.根据权利要求3所述的方法,其特征在于,所述对所述拼音信息中的所述拼音概率和所述第一汉字信息中的所述汉字概率进行所述加权融合,具体包括:
根据预设规则,基于所述位置得到多个位置扩张区域;其中,所述预设规则包括多个左偏移量和多个右偏移量;所述位置扩张区域覆盖所述位置、位于所述位置左侧的所述左偏移量个位置和位于所述位置右侧的所述右偏移量个位置。
5.根据权利要求4所述的方法,其特征在于,所述对所述拼音信息中的所述拼音概率和所述第一汉字信息中的所述汉字概率进行所述加权融合,具体还包括:
将所述第一汉字信息中位于所述位置扩张区域内的所述汉字概率替换为拼音混合加权概率,将所述第一汉字信息中位于所述位置扩张区域外的所述汉字概率替换为汉字混合加权概率,完成加权融合。
6.根据权利要求5所述的方法,其特征在于:
所述拼音混合加权概率由第一权重倍的所述拼音信息中的所述拼音概率与第二权重倍的所述第一汉字信息中的所述汉字概率加权相加得到;
所述汉字混合加权概率由所述第一权重倍的所述第一汉字信息中的所述汉字概率与所述第二权重倍的所述拼音信息中的所述拼音概率加权相加得到;
所述第一权重大于所述第二权重。
7.根据权利要求1-6中任一项所述的方法,其特征在于:
所述拼音信息为拼音概率张量,所述拼音概率张量包含由拼音概率向量构成的拼音概率矩阵;
所述第一汉字信息为汉字概率张量,所述汉字概率张量包含由汉字概率向量构成的汉字概率矩阵;
所述混合信息为混合张量,所述混合张量包含由拼音汉字混合概率向量构成的拼音汉字混合概率矩阵。
8.根据权利要求7所述的方法,其特征在于,所述拼音概率向量、所述汉字概率向量为基于词表的概率向量;所述词表包含若干拼音和若干汉字;
所述拼音概率向量中对应于所述词表拼音处的数值非零,对应于所述词表汉字处的数值为零;
所述汉字概率向量中对应于所述词表拼音处的数值为零,对应于所述词表汉字处的数值非零;
所述拼音汉字混合概率向量中对应于所述词表拼音处和汉字处的数值非零。
9.根据权利要求7或8所述的方法,其特征在于,所述融合所述拼音信息和所述第一汉字信息得到所述混合信息,具体包括:
对所述拼音概率张量中的所述拼音概率向量和所述汉字概率张量中的所述汉字概率向量进行加权融合,得到包含多个拼音汉字混合概率矩阵的所述混合张量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110058472.2/1.html,转载请声明来源钻瓜专利网。