[发明专利]中文语音识别纠错方法、装置及电子设备在审
申请号: | 202110058472.2 | 申请日: | 2021-01-16 |
公开(公告)号: | CN114822519A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 尹旭贤 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L15/16 | 分类号: | G10L15/16;G10L25/51 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 中文 语音 识别 纠错 方法 装置 电子设备 | ||
本申请提供了中文语音识别纠错方法、装置及电子设备,适用于人工智能中的语音识别技术领域,可以中文语音识别和纠错,该方法包括:获取语音数据,并利用中文语音识别纠错模型对语音数据进行处理,得到修正的中文语音识别结果。其中中文语音识别纠错模型是基于神经网络的模型,包含声学模型和第一文本纠错模型两个子模型,可选地,还可以包含语言模型。在本申请实施例中,采用位置扩张加权构成融合了拼音信息和汉字信息的第一混合批输入,因此,本申请实施例中的中文语音识别纠错模型能够充分利用语音数据的信息,纠错效果较好。
技术领域
本申请属于语音识别技术领域,尤其涉及中文语音识别纠错方法、装置及电子设备。
背景技术
基于语音识别(Automatic Speech Recognition,ASR)的人机交互技术,是终端人工智能(Artificial Intelligence,AI)领域中非常重要的一项技术,被广泛应用于各 种电子设备(例如手机、平板电脑、台式电脑等)之中,以提高用户与电子设备之间的 人机交互效率。例如,智能语音助手可以识别用户语音,进而理解用户意图,自动执行 相应的操作;又例如,语音输入法可以识别用户语音,直接转写为文字,省去了打字输 入的复杂过程。基于语音识别进行人机交互的效率,很大程度上依赖于语音识别的效果。
中文语音识别作为语音识别技术领域的一个分支,通常面临以下技术问题。一方面, 中文中的一个读音可以对应于多个汉字,使得中文语音识别容易产生同音字错误;另一 方面,由方言造成的发音习惯问题,使得中文语音识别容易产生易混淆音错误。因此,中文语音识别需要进行纠错,以获得更为准确的识别结果。
发明内容
本发明提供一种中文语音识别纠错方法、装置及电子设备,可以实现针对中文的语 音识别和纠错。
第一方面,本发明提供一种中文语音识别纠错方法,该方法包括:首先,获取语音数据的拼音信息和第一汉字信息。上述语音数据可以是通过电子设备的收音模块实时收录到的用户语音数据,可以是来电子设备存储的一段语音数据等。上述拼音信息和第一 汉字信息是基于上述语音数据得到的,其中可以是先基于语音数据得到拼音信息、再基 于拼音信息得到第一汉字信息,可以是先基于语音数据得到第一汉字信息、再基于汉字 信息得到拼音信息,或者还可以是基于语音数据同时得到拼音信息和第一汉字信息。其 次,融合上述拼音信息和上述第一汉字信息得到混合信息。融合后得到的混合信息包含 有拼音信息中的信息和第一汉字信息中的信息,混合信息中的拼音信息和第一汉字信息 可以是权重相同的或者权重不同的。接下来,应用文本纠错模型对上述混合信息进行处 理,得到第二汉字信息。上述文本纠错模型可以是基于神经网络的模型,文本纠错模型 通过预先使用用于模型训练的语音数据进行训练得到,从而训练好的文本纠错模型具备 对语音数据进行处理并输出纠错结果的功能。由于混合信息中融合了拼音和汉字两方面 的信息,因此文本纠错模型可以综合利用拼音和汉字两方面的信息进行纠错,从而可以 获得较好的纠错效果。得到的上述第二汉字信息中包含有修正的语音识别结果。最后, 输出上述修正的语音识别结果,从而完成中文语音识别纠错。
本发明提供的第一方面的第一个实现方式中,上述拼音信息包含拼音概率,上述第 一汉字信息包含汉字概率。即,可以使用概率数值来表示拼音信息中的不同拼音的可能性大小、表示第一汉字信息中的不同汉字的可能性大小,从而可以在语音数据更可能对 应的拼音或汉字处具有较大的概率数值、在语音数据不太可能对应的拼音或汉字处具有 较小的概率数值,实现用量化的方式表示拼音信息和第一汉字信息。上述概率数值可以 是0到1之间的小数。上述融合拼音信息和第一汉字信息得到混合信息的步骤具体包括: 对上述拼音信息中的拼音概率和上述第一汉字信息中的汉字概率进行加权融合,得到包 含多个子混合信息的上述混合信息。从而使得混合信息中可以同时包含有拼音信息和第 一汉字信息,进而使得上述文本纠错模型可以同时利用拼音和汉字中的信息进行纠错, 可以获得更好的纠错效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110058472.2/2.html,转载请声明来源钻瓜专利网。