[发明专利]一种在线增量的语音获得和识别方法有效
| 申请号: | 201410634670.9 | 申请日: | 2014-11-12 |
| 公开(公告)号: | CN104464721B | 公开(公告)日: | 2018-12-21 |
| 发明(设计)人: | 申富饶;许浩然;赵金熙 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L15/26 |
| 代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 戴朝荣 |
| 地址: | 210000*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 初始化阶段 竞争阶段 语音数据 阈值更新 基准点 去噪 认知 更新 | ||
一种在线增量的语音获得与识别方法,包括初始化阶段、针对语音数据的输入与竞争阶段、基准点更新阶段、作用范围的阈值更新阶段以及去噪阶段。可有效避免现有技术中的所述的模型的训练需要耗费大量的时间、无法实现在线增量、这种方式不符合人的认知习惯由此导致使用很不方便的缺陷。
技术领域
本发明属于语音获得与识别技术领域,具体涉及一种在线增量的语音获得与识别方法。
背景技术
传统的语音识别算法多从统计的角度出发,通过训练大量的数据,从而得出概率相关的模型。若有新的输入语音数据,得出概率相关的模型必须重新进行训练,所述的模型的训练需要耗费大量的时间,而且这种方式不符合人的认知习惯,由此导致使用很不方便。
发明内容
本发明的目的提供一种在线增量的语音获得与识别方法,包括初始化阶段、针对语音数据的输入与竞争阶段、基准点更新阶段、作用范围的阈值更新阶段以及去噪阶段。可有效避免现有技术中的所述的模型的训练需要耗费大量的时间、这种方式不符合人的认知习惯由此导致使用很不方便的缺陷。
为了克服现有技术中的不足,本发明提供了一种在线增量的语音获得与识别方法的解决方案,具体如下:
一种在线增量的语音获得与识别方法,步骤如下:
步骤1:首先,用于处理语音数据的终端接收到外部输入的语音数据;
步骤2:用于处理语音数据的终端接收到外部输入的语音数据后,就进入初始化阶段,所述的初始化阶段具体如下:
1)构建基准点集合A={L1,L2},其中第一基准点L1,第二基准点L2是从外部输入的语音数据中选取的两个随机数据;
2)构建边集合其初始值为空集,即第一基准点L1,第二基准点L2之间没有初始连接;
3)构建第一基准点L1的激活数构建第二基准点L2的激活数
4)构建第一基准点L1的作用范围的阈值构建第二基准点L2的作用范围的阈值所述的 dis tan ce(.,.)为相似性距离算法函数;
步骤3:进入针对语音数据的输入与竞争阶段,所述的针对语音数据的输入与竞争阶段的具体方法如下:
1)从外部对用于处理语音数据的终端输入一个新的语音数据样本ξ∈RD,其中RD表示D维实数向量,D表示自然数;
2)找出A中与ξ最相似的两个基准点,所述的最相似的两个基准点分别为胜者基准点s1和亚军基准点s2,所述的胜者基准点s1和亚军基准点s2分别由如下所示公式所求得:
步骤4:接着进入基准点更新阶段,所述的基准点更新阶段具体如下:
1)如果或者成立,就为基准点集合A 生成一个新的基准点ξ,令A=A∪{ξ},其中表示针对胜者基准点s1的作用范围的阈值,表示针对亚军基准点s2的作用范围的阈值,然后跳转至步骤3中继续执行;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410634670.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:有机感光体及其制造方法
- 下一篇:用于模块化钢带打包机的封接头





