[发明专利]文本纠错方法、装置、电子设备及存储介质在审
申请号: | 202010617088.7 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111881675A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 陈宪涛;葛翔;王璟铭;徐濛 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F40/289 | 分类号: | G06F40/289;G10L15/22;G10L15/26 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 谷春静 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 纠错 方法 装置 电子设备 存储 介质 | ||
本申请公开了文本纠错方法、装置、电子设备及存储介质,涉及自然语言处理及语音识别领域,其中的方法可包括:对用户输入的第一语音进行语音识别,得到识别出的文本;展示文本,并针对文本中的任一分词,分别进行以下处理:将该分词的置信度与预先设定的阈值进行比较,所述置信度为语音识别过程中获取到的该分词被正确识别的信任程度;若该分词的置信度小于阈值,则按照预定方式对所展示的该分词进行标记;展示该分词对应的纠错候选,并将该分词替换为用户选中的纠错候选。应用本申请所述方案,可提升纠错效率和纠错结果的准确性等。
技术领域
本申请涉及计算机应用技术,特别涉及自然语言处理及语音识别领域的文本纠错方法、装置、电子设备及存储介质。
背景技术
用户在使用智能手机或智能手表等进行语音输入时,语音识别引擎会自动地将用户输入的语音识别为文本,并对识别出的文本进行展示,用户确认文本无误后可进行下一步操作。然而,受现实生活中语音输入环境、说话者口音、说话者表达方式等因素的影响,可能会导致识别出的文本中存在错误。
目前的文本纠错方式基本完全依赖于用户的手动操作,比如,用户需要在智能手机或智能手表的小屏幕上移动光标,手动定位错误位置,然后手动删除错误内容,再重新输入正确内容等。这种方式对于用户来说操作繁琐,且效率低下,容易出错等。
发明内容
有鉴于此,本申请提供了文本纠错方法、装置、电子设备及存储介质。
一种文本纠错方法,包括:
对用户输入的第一语音进行语音识别,得到识别出的文本;
展示所述文本,并针对所述文本中的任一分词,分别进行以下处理:
将所述分词的置信度与预先设定的阈值进行比较,所述置信度为所述语音识别过程中获取到的所述分词被正确识别的信任程度;
若所述分词的置信度小于所述阈值,则按照预定方式对所展示的所述分词进行标记;
展示所述分词对应的纠错候选,将所述分词替换为用户选中的纠错候选。
一种文本纠错装置,包括:识别模块以及纠错模块;
所述识别模块,用于对用户输入的第一语音进行语音识别,得到识别出的文本;
所述纠错模块,用于展示所述文本,并针对所述文本中的任一分词,分别进行以下处理:将所述分词的置信度与预先设定的阈值进行比较,所述置信度为所述语音识别过程中获取到的所述分词被正确识别的信任程度;若所述分词的置信度小于所述阈值,则按照预定方式对所展示的所述分词进行标记;展示所述分词对应的纠错候选,将所述分词替换为用户选中的纠错候选。
一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如以上所述的方法。
一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如以上所述的方法。
上述申请中的一个实施例具有如下优点或有益效果:可基于语音识别过程中获取到的置信度自动地对可能识别错误的分词进行定位和标记,并可提供相应的纠错候选供用户选择,进而可利用用户选中的纠错候选替换识别错误的分词,从而简化了用户操作,并提升了纠错效率和纠错结果的准确性等。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010617088.7/2.html,转载请声明来源钻瓜专利网。