[发明专利]语音处理方法及电子设备在审
申请号: | 202010196188.7 | 申请日: | 2020-03-19 |
公开(公告)号: | CN111402864A | 公开(公告)日: | 2020-07-10 |
发明(设计)人: | 卢露露;冯大航;陈孝良 | 申请(专利权)人: | 北京声智科技有限公司 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/18 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 黄灿;左晓菲 |
地址: | 100098 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 处理 方法 电子设备 | ||
本发明提供一种语音处理方法及电子设备,所述方法包括:获取第一客户端发送的待处理语音;基于目标语言模型获取所述待处理语音对应的文本,其中,所述目标语言模型为基于通用语言模型及目标专用语言模型融合得到的语言模型,所述通用语言模型基于通用语料数据训练得到,所述目标专用语言模型基于所述第一客户端发送的语料数据训练得到。本发明实施例能够提高语音识别的效果。
技术领域
本发明涉及自然语言处理技术领域,尤其涉及一种语音处理方法及电子设备。
背景技术
自然语言是指通过自然进化产生的人类之间用于交流的语言。自然语言处理(Natural Language Processing,NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。
自然语言处理技术可以基于语言模型实现对语音的处理,现有技术中,在为企业级客户提供语音识别相关的服务时,由于待处理语音中的词汇涉及专业领域,导致采用通用语言模型进行语音识别的效果较差。
发明内容
本发明实施例提供一种语音处理方法及电子设备,以解决现有技术中由于待处理语音中的词汇涉及专业领域,导致采用通用语言模型进行语音识别效果较差的问题。
为了解决上述技术问题,本发明是这样实现的:
第一方面,本发明实施例提供了一种语音处理方法,所述方法包括:
获取第一客户端发送的待处理语音;
基于目标语言模型获取所述待处理语音对应的文本,其中,所述目标语言模型为基于通用语言模型及目标专用语言模型融合得到的语言模型,所述通用语言模型基于通用语料数据训练得到,所述目标专用语言模型基于所述第一客户端发送的语料数据训练得到。
第二方面,本发明实施例提供了一种电子设备,所述电子设备包括:
第一获取模块,用于获取第一客户端发送的待处理语音;
第二获取模块,用于基于目标语言模型获取所述待处理语音对应的文本,其中,所述目标语言模型为基于通用语言模型及目标专用语言模型融合得到的语言模型,所述通用语言模型基于通用语料数据训练得到,所述目标专用语言模型基于所述第一客户端发送的语料数据训练得到。
第三方面,本发明实施例提供了一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如第一方面所述的语音处理方法中的步骤。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的语音处理方法中的步骤。
本发明实施例中,获取第一客户端发送的待处理语音;基于目标语言模型获取所述待处理语音对应的文本,其中,所述目标语言模型为基于通用语言模型及目标专用语言模型融合得到的语言模型,所述通用语言模型基于通用语料数据训练得到,所述目标专用语言模型基于所述第一客户端发送的语料数据训练得到。这样,在为企业级客户提供语音识别相关的服务时,可以基于企业对应的目标专用语言模型进行处理,从而可以提高语音识别的效果。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种语音处理方法的流程图;
图2是本发明实施例提供的一种语言模型的架构图;
图3是本发明实施例提供的一种电子设备的结构示意图之一;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京声智科技有限公司,未经北京声智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010196188.7/2.html,转载请声明来源钻瓜专利网。