[发明专利]使用多级语料库数据增广进行驾驶舱语音识别声学模型训练的方法和系统在审
| 申请号: | 202010194390.6 | 申请日: | 2020-03-19 | 
| 公开(公告)号: | CN111833850A | 公开(公告)日: | 2020-10-27 | 
| 发明(设计)人: | 王鲁宁;杨威;代智勇 | 申请(专利权)人: | 霍尼韦尔国际公司 | 
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/22;G10L21/02 | 
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 蒋骏;陈岚 | 
| 地址: | 美国新*** | 国省代码: | 暂无信息 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 使用 多级 语料库 数据 增广 进行 驾驶舱 语音 识别 声学 模型 训练 方法 系统 | ||
本发明题为“使用多级语料库数据增广进行驾驶舱语音识别声学模型训练的方法和系统”。本发明公开了一种使通过包括至少一个处理器和系统存储器元件的计算机系统使用声学语音识别(ASR)模型来执行ASR的设备初始化的方法。方法包括通过至少一个处理器经由用户界面获得预定短语的多个语音数据发音。多个语音数据发音包括实际发音的语音数据的第一数量的音频样本,并且多个语音数据发音中的每一个包括音频样本中的一个,音频样本包括声频分量。方法还包括对预定短语的多个语音数据发音执行多次增广以生成语料库音频数据集,语料库音频数据集包括第一数量的音频样本和第二数量的音频样本,第二数量的音频样本包括第一数量的音频样本的增广版本。
技术领域
本公开一般涉及声学语音识别方法和系统。更具体地讲,本公开涉及使用多级语料库数据增广进行驾驶舱语音识别声学模型训练的方法和系统。
背景技术
在现代飞机中,传感器和信息处理技术的进展已使得可供飞行员使用的信息量显著增加。虽然这通常使飞行员能够在任何给定时间获得更好的态势感知,但常常要求飞行员扫描来自若干源的信息以便获得该态势感知。另外,由于现代飞机的复杂性增大,可能要求飞行员控制比以往技术上不太复杂的飞机中存在的更多的飞机系统和子系统。
在飞机操作期间,要求飞行员准确地确定并保持当前飞机状态的各种要素的持续感知,这些要素诸如为速度、海拔高度、位置、飞行方向、外部大气条件、机舱条件、燃油状态和各种参数的变化率以及众多其他要素。此外,特别重要的是在起飞和着陆期间确保飞机在各种参数界限内正常运行,并且外部条件有利于起飞或着陆机动。然而,一般来讲,考虑到飞行员需要在飞机操作的各个阶段期间准确地确定和监测的参数数量,飞行员可能只有非常有限的时间来作出关于飞机控制的重要决策。另外,可能常常要求飞行员从控制仪表移开一只手并且将他或她的注意力从手头的任务转移到操纵用户界面的物理部件(例如,键、刻度盘、按钮、控制杆等)以便根据与所监测的参数相关联的信息来改变飞机操作。飞机的监测和控制有时可给飞行员带来相当大的压力。
近年来为协助飞行员保持态势感知并且减少用户界面的物理部件的操纵而开发的一种方法/系统是声学语音识别(ASR)。ASR方法/系统从飞行员或空中交通管制员接收语音输入并且对飞机系统作出适当的改变,而这原本需要飞行员输入。例如,ASR方法/系统可能能够从空中交通管制员接收语音输入(经由无线电发送到飞机),该语音输入指示改变无线电频率、海拔高度、航向、速度或某种其他飞机操作参数的请求,并且可在飞机的适当系统处识别并自动地输入,从而使飞行员减轻了该负担。在另一个场景中,ASR方法/系统可能能够从飞行员接收语音输入,该语音输入指示改变无线电频率、海拔高度、航向、速度或某种其他飞机操作参数的命令,并且可在飞机的适当系统处识别并自动地输入,从而使飞行员减轻了该负担。
ASR技术的一个挑战是实现可接受的语音识别准确度级别,以便避免对飞机系统的不正确输入。在现有技术ASR方法/系统中,可接受的语音识别准确度级别基于由大量“语音语料库”数据进行的模型训练。如本文所用,术语“语音语料库”数据是指用于训练ASR系统的语音录制“主体”。然而,在航空工业应用中,收集和标记语音语料库数据很困难,这是由于有许多不同讲话者(任何给定飞机通常由许多不同机组人员驾驶)以及周围声音环境(飞行期间的发动机声音和其他声音可使语音语料库数据失真)。
基于上述内容,希望提供使用有限语音语料库数据实现相对较高准确度级别的飞机驾驶舱声学语音识别方法和系统。此外,根据随后的具体实施方式和所附权利要求,结合附图、发明内容、技术领域和本背景技术,本公开的其他期望的特征和特性将变得显而易见。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于霍尼韦尔国际公司,未经霍尼韦尔国际公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010194390.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子照相感光体、处理盒和图像形成装置
 - 下一篇:涂膜剥离剂以及涂膜的剥离方法
 
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
 - 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
 - 数据发送方法、数据发送系统、数据发送装置以及数据结构
 - 数据显示系统、数据中继设备、数据中继方法及数据系统
 - 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
 - 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
 - 数据发送和数据接收设备、数据发送和数据接收方法
 - 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 - 数据发送方法、数据再现方法、数据发送装置及数据再现装置
 





