[发明专利]一种基于未标注关键词数据的关键词检测方法及系统有效
申请号: | 202110810561.8 | 申请日: | 2021-07-19 |
公开(公告)号: | CN113282785B | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 阮晓辉;魏庆凯 | 申请(专利权)人: | 北京快鱼电子股份公司 |
主分类号: | G06F16/65 | 分类号: | G06F16/65;G06F16/683;G06F16/68;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 张彩珍 |
地址: | 100093 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 标注 关键词 数据 检测 方法 系统 | ||
本发明公开了一种基于未标注关键词数据的关键词检测方法及系统,包括采集大量的未标注音频数据,在未标注音频数据中添加预设的唤醒词音频和非唤醒词音频,构成预处理音频库;基于无监督深度学习分类方法对预处理音频库中的音频数据进行分类;对分类后的音频数据提取特征以生成特征数据;将特征数据分别输入至不同类型的神经网络模型中进行训练以得到多个不同的关键词检测模型;基于多个不同的关键词检测模型对待预测音频进行检测以得到最终检测结果;该方法对音频数据进行综合对比分类训练,分类准确率更高。
技术领域
本发明涉及大数据语音分类方法技术领域,具体涉及一种基于未标注关键词数据的关键词检测方法及系统。
背景技术
关键词唤醒技术在生活中较为常见,比如天猫精灵等智能音箱设备,当人们对设备喊出唤醒词时,设备即可唤醒,然后与人进行交互;关键词唤醒功能的实现,要求唤醒系统设备具有低功耗、低误报率、高准确率、低漏报率的特点,为了实现这个目的,通常采用基于深度学习的模型来实现,传统方法中模型的训练需要大量的经标注的关键词数据,以达到理想的效果;而通过智能音箱或者麦克风采集来的关键词数据,大部分都是未标注数据,积累大量数据后,需要对数据进行非常重要的分类标注工作,标注通常采用人工筛选的方法,由标注人员逐个样本试听,给关键词数据打上不同的标签进行标注,再将标注好的音频数据集输入到深度学习模型中进行训练,得到最终的分类模型。
深度学习模型的训练需要足够大的标注好的音频数据,因此上述传统的数据标注方法耗费大量的人力、物力和时间,而且音频数据标注的好坏,直接影响到训练模型的准确与否;为了节省标注所需的人力与时间成本,目前采用无监督大数据音频分类方法,例如利用频谱段对数据进行分类,即从频谱特征值的角度进行音频分类,首先对音频数据提取频谱特征数据,根据频谱特征寻找最优的分类频谱矩阵,最后对频谱数据采用频段进行分类;该方法虽然从频域的角度出发,考虑音频不同频率段的特性对音频进行分类,但其未充分利用音频的综合特征,特别是时域特征,存在分类准确率低,容易导致错分类的问题;同时传统方法中将标注好的音频数据集输入到深度学习模型中进行训练得到的最终分类模型只有一个模型,通过单个分类模型对关键词进行检测也容易导致错分类的问题。
发明内容
针对上述问题,本发明的一个目的是提供一种基于未标注关键词数据的关键词检测方法,该方法综合利用了音频的时、频域特性,从信息聚类的角度出发,利用深度学习的理念,对音频数据进行综合对比分类训练;采用多数据特征和多模型结构的方法,训练出多个关键词检测模型用以投票预测,减小前期无监督自动标注方法带来的误差,从而保证最终结果的准确性,分类准确率更高。
本发明的第二个目的是提供一种基于未标注关键词数据的关键词检测系统。
本发明所采用的第一个技术方案是:一种基于未标注关键词数据的关键词检测方法,包括以下步骤:
S100:采集大量的未标注音频数据,在未标注音频数据中添加预设的唤醒词音频和非唤醒词音频,构成预处理音频库;
S200:基于无监督深度学习分类方法对所述预处理音频库中的音频数据进行分类;
S300:对所述分类后的音频数据提取特征以生成特征数据;
S400:将所述特征数据分别输入至不同类型的神经网络模型中进行训练以得到多个不同的关键词检测模型;
S500:基于所述多个不同的关键词检测模型对待预测音频进行检测以得到最终检测结果。
优选地,步骤S200包括以下子步骤:
S210:提取所述预处理音频库中的音频数据的谱图特征作为原始特征矩阵,对原始特征矩阵进行处理得到转换后的特征矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京快鱼电子股份公司,未经北京快鱼电子股份公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110810561.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种无人机蜂群入室定位系统
- 下一篇:一种用户工作情况评估的方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置