[发明专利]不流畅语言的自动语音识别在审
申请号: | 201710066376.6 | 申请日: | 2017-02-06 |
公开(公告)号: | CN107093427A | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | X·赵;G·塔瓦尔 | 申请(专利权)人: | 通用汽车环球科技运作有限责任公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26;G10L15/07;G10L15/14 |
代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 安文森 |
地址: | 美国密*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流畅 语言 自动 语音 识别 | ||
技术领域
本发明涉及自动语音识别(ASR),更具体地涉及一种不流畅语言的ASR。
背景技术
自动语音识别(ASR)在广泛的各种应用中用以解释从人那里接收到的语音。通常,一个人听到声音提示或命令并对那些提示作出语言响应。ASR系统可以处理语言响应以解释其内容并采取适当的行动。ASR系统确定语言响应内容是否成功可以在很大程度上取决于语言响应的清晰度。但是,许多人很难清楚地表达单词和短语。例如,人们可能会口吃,结巴,或者无法及时生成语言响应。ASR系统可以使用诸如语言听起来像没有这些困难这样的假设来编程。因此,ASR系统可能不能准确地解释那些说话困难的人所提供的语言。
发明内容
根据本发明的一个实施例,提供了一种自动语音识别(ASR)系统中处理不流畅语音的方法。该方法包括通过麦克风接收来自说话人的语音;确定所接收的语音包括不流畅语音;响应于该确定,访问不流畅语音语法或声学模型;并且使用不流畅语音语法来处理所接收的语音。
根据本发明的另一个实施例,提供了一种自动语音识别(ASR)系统中处理不流畅语音的方法。该方法包括通过麦克风接收来自说话人的语音;根据多个不同的不流畅语音类型的其中之一,对所接收的语音进行分类;修改补偿所划分的不流畅语音类型的一个或多个ASR变量;并且使用修改后的ASR变量处理所接收的语音。
附图说明
以下将结合附图,对本发明的一个或多个实施例进行描述,其中相同的附图标记表示相同的元件,并且其中:
图1是示出了能够利用本发明所公开方法的通信系统的一个实施例的框图;并且
图2是示出了自动语音识别(ASR)系统的一个实施例的框图;并且
图3是示出了自动语音识别(ASR)系统中处理不流畅语音的方法的一个实施例的流程图。
具体实施方式
以下描述的系统和方法涉及ASR系统,其接收来自用户的语音并对其内容进行解释。作为解释所接收的语音的一部分,ASR系统可以被配置为确定何时存在不流畅语音,然后补偿不流畅语音,使它可以被成功地解释。一般来说,不流畅语音或语音不流畅形容那些包括发生在所接收的语音内的中断、不规则、咕噜声或非词汇声音的语音。不流畅语音可以由许多不同因素造成,例如年龄大、意外事故、中风或偏瘫(例如,Bell麻痹)。不流畅语音不仅可以通过其存在进行识别,而且还可以通过所接收的不流畅语音类型进行识别。例如,不流畅语音类型包括结巴、口吃、过度呼吸、语速慢或鼻音。ASR系统可以通过构建并部署统计语言模型来补偿不流畅语音,这些模型经过优化以理解普通或特定类型的不流畅语音中的不流畅语音。还可以改变那些通常设立以利于识别流畅语音的一个或多个ASR变量。因为已经识别了语音障碍或情绪失调的类型,所以可以使用专用的声学模型来提高语音识别性能。这将在下面更详细地讨论。
通信系统
参照图1,示出了包括移动车辆通信系统10并且可以用于实施本发明所公开的方法的操作环境。通信系统10通常包括车辆12,一个或多个无线载波系统14,陆地通信网络16,计算机18和呼叫中心20。应当理解的是,所公开的方法可以与任何数量的不同系统一起使用,并没有特别限于本文所示的操作环境。同样,系统10及其各个部件的架构、构造、设置和操作通常是本领域已知的。因此,以下段落简单地提供一个这种通信系统10的简要概述;但是,本文未示出的其他系统也可以采用本发明所公开的方法。
车辆12在所示实施例中被示为小客车,但是,应当理解的是,也可以使用任何其他车辆,包括摩托车、卡车、运动型多用途车(SUVs)、休闲车(RVs)、船舶、飞机等等。一些车辆电子装置28通常在图1中示出,包括远程信息处理单元30、麦克风32、一个或多个按钮或其他控制输入34、音频系统36、可视显示器38和GPS模块40,以及多个车辆系统模块(VSMs)42。这些装置中的一些可以直接连接到远程信息处理单元,例如麦克风32和按钮34,而其他装置使用一个或多个网络连接(例如通信总线44或娱乐总线46)间接连接到远程信息处理单元。合适的网络连接的示例包括控制器局域网(CAN)、面向媒体的系统传输(MOST)、局域互联网络(LIN)、局域网(LAN)以及其他适当的连接(例如以太网或其他符合已知的ISO、SAE和IEEE标准和规范的网络),仅举几个例子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通用汽车环球科技运作有限责任公司,未经通用汽车环球科技运作有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710066376.6/2.html,转载请声明来源钻瓜专利网。