[发明专利]热词语音识别方法、装置、电子设备及存储介质有效
申请号: | 202110293484.3 | 申请日: | 2021-03-19 |
公开(公告)号: | CN112700764B | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 赵超 | 申请(专利权)人: | 北京沃丰时代数据科技有限公司 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L15/08;G10L15/14;G10L15/16 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王宇杨 |
地址: | 100160 北京市丰台区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 词语 识别 方法 装置 电子设备 存储 介质 | ||
本发明提供一种热词语音识别方法、装置、电子设备及存储介质,其中方法包括:获取多条待处理语音;多条待处理语音包括热词语音,以及将热词语音中的热词替换为混淆词的混淆语音;其中混淆词为热词的同音词或相似音词;基于语音识别系统对多条待处理语音进行语音识别处理,根据热词语音的语音识别结果与混淆语音的语音识别结果计算分值差,获取热词语音中的热词的激励值;确认热词的激励值大于预设阈值时,无需对热词所在路径的分值进行激励。本发明提供的热词语音识别方法,通过获取多条待处理语音,基于语音识别系统对多条待处理语音进行语音识别处理,自动获取热词的激励值,提高了语音识别的准确率和识别效率,同时避免了误激励情况的发生。
技术领域
本发明涉及语音识别技术领域,更具体地说,涉及热词语音识别方法、装置、电子设备及存储介质。
背景技术
随着人工智能产品在日常生活中的渗透率越来越高,语音识别技术作为人机自然交互的基本途径,在智能家居、智能汽车、智能客服等场景下有着广泛的应用。
目前,语音识别技术在通用场景中已达到较高的识别效果,特别是在客服领域实际应用中,用户会经常根据实际情况需要进行自定义解码。这种自定义解码的需求往往具有一定的特殊性与时效性,会出现一些具有时效性和个性化的词语,这些词语称之为热词。如电商根据活动需求,设置“一元”购物活动,而与此同时,其他用户可能会进行“亿元补贴”活动,其中,亿元补贴为热词短语,亿元为热词等。
现有技术中,解决这些热词识别的方法主要是采用热词激励的方式,对于任意的一个热词短语,可以根据词典对其进行分词处理,此时其变成一个词序列。当热词语音在语音识别处理过程中,遇到预先设置的热词序列时,对热词所在路径的得分直接进行激励,增大热词的输出概率,以使预设热词出现在最优输出路径中。但是,这种热词激励的方法具有一定的缺陷,热词短词会存在误激励问题,导致语音识别的准确率不高;另外对于不同的模型及不同热词,激励值也不同,目前激励值的获取需要靠经验设置,这种设置方式会影响语音识别的效率。
发明内容
本发明提供热词语音识别方法、装置、电子设备及存储介质,用以解决现有技术中热词短词存在误激励和激励值靠经验获取的技术问题,以实现提高系统语音识别准确率和识别效率的目的。
第一方面,本发明提供一种热词语音识别方法,包括:获取多条待处理语音;所述多条待处理语音包括热词语音,以及将所述热词语音中的热词替换为混淆词的混淆语音;其中所述混淆词为所述热词的同音词或相似音词;基于语音识别系统对所述多条待处理语音进行语音识别处理,根据所述热词语音的语音识别结果与所述混淆语音的语音识别结果计算分值差,获取所述热词语音中的热词的激励值;确认所述热词的激励值大于预设阈值时,无需对所述热词所在路径的分值进行激励。
根据本发明提供的一种热词语音识别方法,还包括:确认所述热词的激励值小于或等于预设阈值时,对所述热词所在路径的分值进行正向激励。
根据本发明提供的一种热词语音识别方法,还包括:确认所述热词的激励值小于或等于预设阈值时,对所述混淆词所在路径的分值进行反向激励。
根据本发明提供的一种热词语音识别方法,所述获取多条待处理语音,包括:获取所述热词语音的文本数据;从所述文本数据中提取热词,基于语音字典,确定所述热词的混淆词;根据所述热词语音的文本数据以及所述混淆词,得到所述混淆语音的文本数据;根据所述混淆语音的文本数据以及所述热词语音的文本数据,得到多条语音。
根据本发明提供的一种热词语音识别方法,所述根据所述混淆语音的文本数据以及所述热词语音的文本数据,得到多条语音,包括:基于所述混淆语音的文本数据以及所述热词语音的文本数据,通过模拟多个说话人和多个音色的方式实现语音合成,得到与所述热词语音相关的多条语音。
根据本发明提供的一种热词语音识别方法,在所述从所述文本数据中提取热词,基于语音字典,确定所述热词的混淆词的步骤之前,包括:对所述热词语音的文本数据进行清洗。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃丰时代数据科技有限公司,未经北京沃丰时代数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110293484.3/2.html,转载请声明来源钻瓜专利网。