[发明专利]一种语音识别结果纠错方法及装置在审
申请号: | 201911159272.5 | 申请日: | 2019-11-22 |
公开(公告)号: | CN112835494A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 杜国威 | 申请(专利权)人: | 北京安云世纪科技有限公司 |
主分类号: | G06F3/0484 | 分类号: | G06F3/0484;G06F3/0488;G06F40/232;G10L15/26 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 王玉双 |
地址: | 100102 北京市朝阳区酒仙桥路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 结果 纠错 方法 装置 | ||
本发明公开了一种语音识别结果纠错方法及装置,所述方法包括:展示用户输入的第一语音信息对应的第一语音识别结果;接收所述用户输入在所述第一语音识别结果上的触控操作,并确定所述触控操作对应的待纠错字词;根据所述待纠错字词获取目标纠错字词;根据所述目标纠错字词替换所述待纠错字词,获得第一语音纠错结果。用户只需点击待纠错字词,即可获取所述待纠错字词对应的目标纠错字词,并自动根据所述目标纠错字词替换所述待纠错字词,从而对语音识别结果进行纠错,提高了用户体验,降低了语音识别结果的纠错难度。
技术领域
本发明涉及语音识别技术领域,尤其涉及一种语音识别结果纠错方法及装置。
背景技术
如图1所示,一次完整的语音交互过程包括:语音识别(ASR)、自然语言理解处理(NLP)、语义解析(Skill)以及从文本到语音(TTS)的流程,从而实现对用户发出的语音信息进行回应。语音识别是语音交互中关键的一环,目前语音识别在体验上存在以下痛点:语音识别的识别过程是不可逆的,一旦用户在输入语音信息时某一个字词说错或者发音不准确则可能导致识别结果出现错误。
在使用智能音箱时(或手机上的语音助手)时,当用户发出语音信息“帮我订明天的机票”后接着发出语音信息“不对,订今天的”,现有技术中的智能音箱只能识别出完整的语音信息,而无法在用户输入的两种语义中识别出用户的真实意图,无法对语音信息进行纠错。
因此,现有技术中如何实现对语音信息进行纠错是亟待解决的技术问题。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的语音识别结果纠错方法及装置。
依据本发明的第一个方面,提供了一种语音识别结果纠错方法,所述语音识别结果纠错方法包括:
展示用户输入的第一语音信息对应的第一语音识别结果;
接收所述用户输入在所述第一语音识别结果上的触控操作,并确定所述触控操作对应的待纠错字词;
根据所述待纠错字词获取目标纠错字词;
根据所述目标纠错字词替换所述待纠错字词,获得第一语音纠错结果。
优选的,所述接收所述用户输入在所述第一语音识别结果上的触控操作,并确定所述触控操作对应的待纠错字词,包括:
对所述第一语音识别结果进行分词,获得分词结果,所述分词结果包括多组字词;
按照所述分词结果将所述第一语音识别结果所处的展示区域对应划分为多个子区域;
接收所述用户输入在所述第一语音识别结果上的触控操作;
识别所述触控操作所处的目标子区域,并将所述目标子区域内的字词确定为待纠错字词。
优选的,所述根据所述待纠错字词获取目标纠错字词,包括:
按照排列的先后顺序依次在所述待纠错字词中选取当前待纠错字词,并将所述当前待纠错字词设为待定状态;
在所述待定状态下获取所述当前待纠错字词对应的目标纠错字词。
优选的,所述目标纠错字词包括:第二语音识别结果;
所述在所述待定状态下获取所述当前待纠错字词对应的目标纠错字词,包括:
在所述待定状态下接收所述用户输入的第二语音信息;
对所述第二语音信息进行语音识别,获得第二语音识别结果;
所述根据所述目标纠错字词替换所述待纠错字词,获得第一语音纠错结果,包括:
根据所述第二语音识别结果替换所述待纠错字词,获得第一语音纠错结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京安云世纪科技有限公司,未经北京安云世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911159272.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:扬声器模组及便携式电子设备
- 下一篇:偏心轴固定机构、车门锁紧机构以及车辆