[发明专利]一种在线增量的语音获得和识别方法有效

申请号：	201410634670.9	申请日：	2014-11-12
公开（公告）号：	CN104464721B	公开（公告）日：	2018-12-21
发明（设计）人：	申富饶;许浩然;赵金熙	申请（专利权）人：	南京大学
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/26
代理公司：	南京钟山专利代理有限公司 32252	代理人：	戴朝荣
地址：	210000***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音初始化阶段竞争阶段语音数据阈值更新基准点去噪认知更新
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种在线增量的语音获得与识别方法，包括初始化阶段、针对语音数据的输入与竞争阶段、基准点更新阶段、作用范围的阈值更新阶段以及去噪阶段。可有效避免现有技术中的所述的模型的训练需要耗费大量的时间、无法实现在线增量、这种方式不符合人的认知习惯由此导致使用很不方便的缺陷。

技术领域

本发明属于语音获得与识别技术领域，具体涉及一种在线增量的语音获得与识别方法。

背景技术

传统的语音识别算法多从统计的角度出发，通过训练大量的数据，从而得出概率相关的模型。若有新的输入语音数据，得出概率相关的模型必须重新进行训练，所述的模型的训练需要耗费大量的时间，而且这种方式不符合人的认知习惯，由此导致使用很不方便。

发明内容

本发明的目的提供一种在线增量的语音获得与识别方法，包括初始化阶段、针对语音数据的输入与竞争阶段、基准点更新阶段、作用范围的阈值更新阶段以及去噪阶段。可有效避免现有技术中的所述的模型的训练需要耗费大量的时间、这种方式不符合人的认知习惯由此导致使用很不方便的缺陷。

为了克服现有技术中的不足，本发明提供了一种在线增量的语音获得与识别方法的解决方案，具体如下：

一种在线增量的语音获得与识别方法，步骤如下：

步骤1：首先，用于处理语音数据的终端接收到外部输入的语音数据；

步骤2：用于处理语音数据的终端接收到外部输入的语音数据后，就进入初始化阶段，所述的初始化阶段具体如下：

1)构建基准点集合A＝{L₁,L₂},其中第一基准点L₁,第二基准点L₂是从外部输入的语音数据中选取的两个随机数据；

2)构建边集合其初始值为空集,即第一基准点L₁,第二基准点L₂之间没有初始连接；

3)构建第一基准点L₁的激活数构建第二基准点L₂的激活数

4)构建第一基准点L₁的作用范围的阈值构建第二基准点L₂的作用范围的阈值所述的 dis tan ce(.,.)为相似性距离算法函数；

步骤3：进入针对语音数据的输入与竞争阶段，所述的针对语音数据的输入与竞争阶段的具体方法如下：

1)从外部对用于处理语音数据的终端输入一个新的语音数据样本ξ∈R^D，其中R^D表示D维实数向量，D表示自然数；

2)找出A中与ξ最相似的两个基准点,所述的最相似的两个基准点分别为胜者基准点s₁和亚军基准点s₂,所述的胜者基准点s₁和亚军基准点s₂分别由如下所示公式所求得：

步骤4：接着进入基准点更新阶段，所述的基准点更新阶段具体如下：

1)如果或者成立,就为基准点集合A 生成一个新的基准点ξ,令A＝A∪{ξ}，其中表示针对胜者基准点s₁的作用范围的阈值，表示针对亚军基准点s₂的作用范围的阈值，然后跳转至步骤3中继续执行；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京大学，未经南京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410634670.9/2.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载