[发明专利]一种在线增量的语音获得和识别方法有效

专利信息
申请号: 201410634670.9 申请日: 2014-11-12
公开(公告)号: CN104464721B 公开(公告)日: 2018-12-21
发明(设计)人: 申富饶;许浩然;赵金熙 申请(专利权)人: 南京大学
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L15/26
代理公司: 南京钟山专利代理有限公司 32252 代理人: 戴朝荣
地址: 210000*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语音 初始化阶段 竞争阶段 语音数据 阈值更新 基准点 去噪 认知 更新
【说明书】:

一种在线增量的语音获得与识别方法,包括初始化阶段、针对语音数据的输入与竞争阶段、基准点更新阶段、作用范围的阈值更新阶段以及去噪阶段。可有效避免现有技术中的所述的模型的训练需要耗费大量的时间、无法实现在线增量、这种方式不符合人的认知习惯由此导致使用很不方便的缺陷。

技术领域

发明属于语音获得与识别技术领域,具体涉及一种在线增量的语音获得与识别方法。

背景技术

传统的语音识别算法多从统计的角度出发,通过训练大量的数据,从而得出概率相关的模型。若有新的输入语音数据,得出概率相关的模型必须重新进行训练,所述的模型的训练需要耗费大量的时间,而且这种方式不符合人的认知习惯,由此导致使用很不方便。

发明内容

本发明的目的提供一种在线增量的语音获得与识别方法,包括初始化阶段、针对语音数据的输入与竞争阶段、基准点更新阶段、作用范围的阈值更新阶段以及去噪阶段。可有效避免现有技术中的所述的模型的训练需要耗费大量的时间、这种方式不符合人的认知习惯由此导致使用很不方便的缺陷。

为了克服现有技术中的不足,本发明提供了一种在线增量的语音获得与识别方法的解决方案,具体如下:

一种在线增量的语音获得与识别方法,步骤如下:

步骤1:首先,用于处理语音数据的终端接收到外部输入的语音数据;

步骤2:用于处理语音数据的终端接收到外部输入的语音数据后,就进入初始化阶段,所述的初始化阶段具体如下:

1)构建基准点集合A={L1,L2},其中第一基准点L1,第二基准点L2是从外部输入的语音数据中选取的两个随机数据;

2)构建边集合其初始值为空集,即第一基准点L1,第二基准点L2之间没有初始连接;

3)构建第一基准点L1的激活数构建第二基准点L2的激活数

4)构建第一基准点L1的作用范围的阈值构建第二基准点L2的作用范围的阈值所述的 dis tan ce(.,.)为相似性距离算法函数;

步骤3:进入针对语音数据的输入与竞争阶段,所述的针对语音数据的输入与竞争阶段的具体方法如下:

1)从外部对用于处理语音数据的终端输入一个新的语音数据样本ξ∈RD,其中RD表示D维实数向量,D表示自然数;

2)找出A中与ξ最相似的两个基准点,所述的最相似的两个基准点分别为胜者基准点s1和亚军基准点s2,所述的胜者基准点s1和亚军基准点s2分别由如下所示公式所求得:

步骤4:接着进入基准点更新阶段,所述的基准点更新阶段具体如下:

1)如果或者成立,就为基准点集合A 生成一个新的基准点ξ,令A=A∪{ξ},其中表示针对胜者基准点s1的作用范围的阈值,表示针对亚军基准点s2的作用范围的阈值,然后跳转至步骤3中继续执行;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410634670.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top