[发明专利]语音识别系统优化方法和装置在审

申请号：	202111076518.X	申请日：	2021-09-14
公开（公告）号：	CN113793604A	公开（公告）日：	2021-12-14
发明（设计）人：	薛少飞	申请（专利权）人：	思必驰科技股份有限公司
主分类号：	G10L15/20	分类号：	G10L15/20;G10L15/06;G10L15/22
代理公司：	北京商专永信知识产权代理事务所(普通合伙) 11400	代理人：	黄谦;邓婷婷
地址：	215123 江苏省苏州市苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音识别系统优化方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开一种语音识别系统优化方法和装置，其中，语音识别系统优化方法，包括：将待筛选音频数据分别输入至目标优化ASR系统和N个可用ASR系统中进行语音识别得到N+1个语音识别结果；对N+1个语音识别结果进行度量，确定M个语音识别结果并将M个语音识别结果送入标注专家进行标注；以及将标注专家标注过的M个语音识别结果再输入至目标ASR系统以对所述目标ASR系统进行优化。本申请实施例的方案通过将待优化指标(识别准确率)融入到系统设计中，使得设计出的主动学习方法能够优化这一指标，能够有效提升主动学习在语音识别应用中的效果，并且可以在只获得语音识别文字结果的情况下，利用多系统进行优化，大大降低了应用主动学习技术的门槛。

技术领域

本发明属于语音识别技术领域，尤其涉及语音识别系统优化方法和装置。

背景技术

相关技术中，主动学习是近年来比较热门的技术，在学术届有比较多的论文进行相关研究，主要应用在文档分类和信息提取、图像检索、入侵检测、自然语言处理、语音环境识别等领域。

在真实的数据分析场景中，我们可以获取海量的数据，但是这些数据都是未标注数据，很多经典的分类算法并不能直接使用。那肯定会有人说，数据是没有标注的，那我们就标注数据喽！这样的想法很正常也很单纯，但是数据标注的代价是很大的，即使我们只标注几千或者几万训练数据，标注数据的时间和金钱成本也是巨大的。因此，为了尽可能地减小训练集及标注成本，在机器学习领域中，提出主动学习(active learning)方法，优化分类模型。主动学习(active learning)，指的是这样一种学习方法：有的时候，有类标的数据比较稀少而没有类标的数据是相当丰富的，但是对数据进行人工标注又非常昂贵，这时候，学习算法可以主动地提出一些标注请求，将一些经过筛选的数据提交给专家进行标注。这个筛选过程也就是主动学习主要研究的地方。

请参考图1，主动学习的模型如下：A＝(C,Q,S,L,U)，其中C为一组或者一个分类器，L是用于训练已标注的样本。Q是查询函数，用于从未标注样本池U中查询信息量大的信息，S是督导者，可以为U中样本标注正确的标签。学习者通过少量初始标记样本L开始学习，通过一定的查询函数Q选择出一个或一批最有用的样本，并向督导者询问标签，然后利用获得的新知识来训练分类器和进行下一轮查询。主动学习是一个循环的过程，直至达到某一停止准则为止。

查询函数Q用于查询一个或一批最有用的样本。那么，什么样的样本是有用的呢？即查询函数查询的是什么样的样本呢？在各种主动学习方法中，查询函数的设计最常用的策略是：不确定性准则(uncertainty)和差异性准则(diversity)。

对于不确定性，我们可以借助信息熵的概念来进行理解。我们知道信息熵是衡量信息量的概念，也是衡量不确定性的概念。信息熵越大，就代表不确定性越大，包含的信息量也就越丰富。事实上，有些基于不确定性的主动学习查询函数就是使用了信息熵来设计的，比如熵值装袋查询(Entropy query-by-bagging)。所以，不确定性策略就是要想方设法地找出不确定性高的样本，因为这些样本所包含的丰富信息量，对我们训练模型来说就是有用的。

差异性的理解，之前说到或查询函数每次迭代中查询一个或者一批样本。我们当然希望所查询的样本提供的信息是全面的，各个样本提供的信息不重复不冗余，即样本之间具有一定的差异性。在每轮迭代抽取单个信息量最大的样本加入训练集的情况下，每一轮迭代中模型都被重新训练，以新获得的知识去参与对样本不确定性的评估可以有效地避免数据冗余。但是如果每次迭代查询一批样本，那么就应该想办法来保证样本的差异性，避免数据冗余。

样例选择算法：根据获得未标注样例的方式，可以将主动学习分为两种类型：基于流的和基于池的。基于流(stream-based)的主动学习中，未标记的样例按先后顺序逐个提交给选择引擎，由选择引擎决定是否标注当前提交的样例，如果不标注，则将其丢弃。基于池(pool-based)的主动学习中则维护一个未标注样例的集合，由选择引擎在该集合中选择当前要标注的样例。

基于池的样例选择算法

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于思必驰科技股份有限公司，未经思必驰科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111076518.X/2.html，转载请声明来源钻瓜专利网。

上一篇：一种注意力分析方法、智能终端、智能坐垫以及系统
下一篇：一种可实现可变喷油规律的电控高压共轨喷油器

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音识别系统优化方法和装置在审

专利文献下载