[发明专利]农业现场数据采集的移动设备语音识别的鲁棒性方法有效
申请号: | 201110453994.9 | 申请日: | 2011-12-30 |
公开(公告)号: | CN102426837A | 公开(公告)日: | 2012-04-25 |
发明(设计)人: | 诸叶平;赵俊峰 | 申请(专利权)人: | 中国农业科学院农业信息研究所 |
主分类号: | G10L15/20 | 分类号: | G10L15/20 |
代理公司: | 北京三友知识产权代理有限公司 11127 | 代理人: | 汤在彦 |
地址: | 100081 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 农业 现场 数据 采集 移动 设备 语音 识别 鲁棒性 方法 | ||
技术领域
本发明涉及属于智能信息处理、农业信息技术领域,尤其是指一种农业现场数据采集的移动设备语音识别的鲁棒性方法。
背景技术
我国地域跨度大,地理环境复杂,农业生产水平和科技水平发展不平衡,移动设备的应用多样性和灵活性可以帮助解决在农业信息化进程中所遇到的来源于基层的前端技术困难,即原始信息的采集和控制问题。语音识别技术是解决移动设备交互问题的重要途径,随着农业现代化进程的不断深入,语音识别技术在农业信息领域的重要性越来越突出,在农业科学研究、农业生产和农产品信息采集领域都有着广泛应用。但基于移动设备的语音识别距离实用化还有一定距离,一方面,移动条件下各种不良声学环境的环境噪声限制了语音识别技术的应用,另一方面,非特定人连续语音识别对移动设备的语音识别技术提出了更高的鲁棒性要求。现有的语音识别鲁棒性方法主要面临以下问题:
1、语音信号是一种非平稳信号,常用的噪声补偿方法都是建立在线性平稳信号的假设上,考虑时变因素和非线性影响的情形非常复杂。
2、连续语音信号的声学特征随其前后相连的语音的不同而有很大差异,限制了语音识别在低信噪比移动设备上的实际应用。
3、大词汇量连续语音识别系统适应性差,对环境的依赖性较强,噪声环境下语音识别准确率的提高难度大。
在通用领域大词汇量连续语音识别的背景下解决上述问题非常困难,在特定领域中小词汇量的应用方面,移动设备的语音识别应用需要适应小数据的新环境,而桌面语音识别常用的具有复杂参数的最大似然线性回归方法复杂度又超出了移动设备的计算能力。
发明内容
本发明要解决的技术问题是:提出一种农业现场数据采集的移动设备语音识别鲁棒性方法,提高了识别鲁棒性,降低了识别难度,改善了农业现场数据采集语音识别的环境适应性。
本发明的技术解决方案是:一种农业现场数据采集的移动设备语音识别的鲁棒性方法,该方法是基于移动设备语音识别特征补偿和模型补偿相结合的抗噪方法,针对农业现场数据采集典型应用场景的非平稳噪声环境,寻找稳健的耐噪声语音特征参数以及从含噪语音中提取的特征进行处理,去除由噪声引起的含噪语音特征和纯净语音特征之间的偏差,以有效提高系统识别准确率。
本发明的特点和优点是:本发明为提高农业现场数据采集语音识别的鲁棒性,针对农业现场数据采集典型应用场景的非平稳噪声环境,寻找稳健的耐噪声语音特征参数以及从含噪语音中提取的特征进行处理,提出一种基于移动设备语音识别特征补偿和模型补偿相结合的抗噪方法,去除由噪声引起的含噪语音特征和纯净语音特征之间的偏差,以达到有效提高系统识别准确率的目的,在农业现场数据采集领域中小词汇量低信噪比条件下,本发明提高了移动设备语音识别在室内、室外和野外典型环境下的抗噪特性,具有一定的可靠性和实用性。
本方法复杂性低,更容易实施,同时由于基于农业特定情景的偏差模式要求的训练数据少,实时性好,更适合于在移动设备有限的计算和存储资源条件下应用。
附图说明
图1为本发明的农业现场数据采集的移动设备语音识别的鲁棒性方法的原理图。
图2为本发明的农业现场数据采集的移动设备语音识别的鲁棒性方法的模块框图。
具体实施方式
下面配合附图及具体实施例对本发明的具体实施方式作进一步的详细说明。
本发明提出一种农业现场数据采集的移动设备语音识别的鲁棒性方法,所述方法包括模型补偿、场景偏差计算、初始权重调整、环境补偿和自适应控制;语音信号经过模型补偿进行MFCC特征提取,与权值系数完成卷积运算,与背景噪声完成迭加后得到含噪特征矢量,然后经过场景偏差计算,根据计算结果进行场景初始权重系数调整,使场景初始权重根据输入信号的变动自动学习,而不断调整权值系数并始终保持均方差最小。
语音在从产生、采集为数字信号、调制传输解调整个过程都不可避免的受到外界的干扰,包括周围环境噪声的影响,语音信号采集设备的影响,传输调制信道的影响等。语音特征分布的环境变量的变化比语音信号变量的变化要慢,在一个短时间窗的噪声语音和模型分布之间进行随机匹配,从噪声语音数据找出并去除瞬间的非语音变化,可以使得语音识别精度可得到显著改善。
如图1所示,其为本发明的设计原理图。本发明是基于稳定性的考虑提出的一种基于模式的动态补偿方案,用来改善移动环境下语音识别的鲁棒性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业科学院农业信息研究所,未经中国农业科学院农业信息研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110453994.9/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置