[发明专利]一种基于分层量化的轻量级神经网络语音关键词识别方法在审

专利信息
申请号: 202110101761.6 申请日: 2021-01-26
公开(公告)号: CN112786021A 公开(公告)日: 2021-05-11
发明(设计)人: 陆生礼;胡忠元;庞伟 申请(专利权)人: 东南大学
主分类号: G10L15/02 分类号: G10L15/02;G10L15/06;G10L15/16;G10L25/24;G10L15/28;G10L15/26;G10L15/20;G10L19/02
代理公司: 南京瑞弘专利商标事务所(普通合伙) 32249 代理人: 沈廉
地址: 211189 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分层 量化 轻量级 神经网络 语音 关键词 识别 方法
【说明书】:

发明公开了一种基于分层量化的轻量级神经网络语音关键词识别方法,属于计算、推理、计数的技术领域。该系统包括:语音采集模块、特征提取模块、轻量级神网络加速器以及分层8bits量化模块等。轻量级神经网络采用深度可分离卷积神经网络和注意力机制Squeeze‑and‑Excitation,通过将传统卷积替换成深度可分离卷积,降低神经网络的参数量和计算量,通过引入注意力机制,标注卷积过程中不同通道上特征的重要程度,提高模型的识别准确率,通过对神经网络的权重值量化和激活值分层8bits量化,进一步降低模型的计算复杂度和神经网络的参数量,通过设计支持通道分离卷积和传统卷积的加速器,满足对数据带宽的不同需求,从而加速前向推理计算的过程。

技术领域

本发明涉及一种基于分层8bits量化轻量级神经网络的语音关键词识别方法及系统技术,属于计算、推理、技术的技术领域。

背景技术

随着越来越多的智能语音助手出现在我们的生活中,我们会愈发地感受到,人们与智能终端的交互方式,正从触控模式慢慢转入到语音交互的模式上。同时,随着设备计算能力的发展、语音关键词识别技术的积累和语音数据的丰富,智能音响、车载语音交互等行业呈现出快速发展的状态,人机交互的频率越来越高,语音关键词识别相关的应用已经开始实实在在地在我们日常生活中普及开来,语音关键词识别系统拥有很多应用场景,如智能音响、车载交互等。

目前语音关键词识别主要通过云端和终端两种方式部署。通过云端方式识别,由于云端的资源充足,可以部署大型的神经网络进行语音识别,识别率非常高,但是在云端进行语音识别就需要将语音数据上传到云端,存在着数据泄露、数据传输延迟及成本高等问题。由于离线识别能够保障数据的安全性和实时性,所以在终端部署语音识别能够避免云端部署存在的问题,但是在终端部署高准确率的识别系统也面临着资源有限的问题。另外,语音关键词识别的精度、功耗及速度之间的平衡关系因不同的场景而变化。

发明内容

技术问题:本发明的发明目的是针对上述背景技术的不足,提出了一种基于分层量化的轻量级神经网络语音关键词识别方法,充分利用深度可分离卷积所带来的参数量和计算量大量减少的优势和注意力机制标注卷积过程中不同通道上特征的重要程度,进而提高模型识别的准确度和速度。通过分层8bits量化操作,将浮点运算转变成定点运算,减低了计算的复杂度与能耗,解决了现有语音关键词识别系统在移动终端和嵌入式设备中部署的技术问题。

技术方案:本发明的一种基于分层量化的轻量级神经网络语音关键词识别方法采用主要步骤如下:

步骤1.获取关键词语音音频数据集并对关键词语音音频数据进行增强;

步骤2.对所述增强的关键词语音音频数据通过特征提取模块提取音频信号中的声学特征;

步骤3.将所述音频信号中的声学特征组成特征向量送入到轻量级神经网络模型中进行训练,根据训练结果保存神经网络各层的权重参数,通过分层8bits量化将权重参数量化成8位并保存。

步骤4.设计支持通道分离卷积和传统卷积的神经网络加速器,加载所述量化后的8位权重到神经网络加速器中,加速前向推理计算过程,根据神经网络加速器的输出得到不同关键词的概率值;

步骤5.将所述不同关键词概率值中的最大值和预设阈值进行比较,大于阈值则根据预测结果判别输入的语音关键词,小于阈值则表示输入的语音中没有关键词。

所述语音增强包括添加噪声信号、对关键词信号随机左移或右移,增强系统的鲁棒性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110101761.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top