[发明专利]一种伪冒语音的识别方法、设备及计算机可读存储介质在审
| 申请号: | 202010688484.9 | 申请日: | 2020-07-16 |
| 公开(公告)号: | CN111933154A | 公开(公告)日: | 2020-11-13 |
| 发明(设计)人: | 张超;马骏;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
| 主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/14;G10L17/18 |
| 代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
| 地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 识别 方法 设备 计算机 可读 存储 介质 | ||
本申请实施例属于人工智能领域,涉及一种伪冒语音的识别方法,包括:获取待识别语音;对待识别语音进行STFT变换处理,将待识别语音转换为待识别语音信号特征图;将待识别语音信号特征图输入目标DenseNet网络模型,输出待识别语音为真实语音或伪冒语音的二分类判别结果。本申请还提供一种伪冒语音的识别装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,获取的用户的语音数据和二分类判别结果可存储于区块链中。本方案通过利用目标DenseNet网络模型进行语音识别工作,基于神经网络的自学习功能,提供了一种准确度高的自动识别伪冒语音的方法,减少ASV或者声纹系统安全漏洞的产生。本申请可应用于智慧医疗、智慧政务、智慧教育或科技金融等领域。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种伪冒语音的识别方法、识别设备、计算机设备和计算机可读存储介质。
背景技术
随着语音识别和人工智能(artificial intelligence,AI)技术的逐步发展,其在实际应用中越来越普遍,尤其是说话人自动确认(automatic speaker verification,ASV)技术和声纹技术普遍用于手机唤醒,语音解锁,智能音箱和语音支付领域。
然而需要说明的是,ASV或者声纹系统本身并不具备识别伪冒语音的能力,并且随着语音合成从文本到语言(text to speech,TTS)技术的成熟,现在语音端的伪冒语音越来越难以识别,包括高质量录音设备录音重放,最新技术的语音合成等。对未来尤其是跟安全领域相关的方向使用ASV和声纹技术时,或者未来涉及到大数据挖掘方向时,能否区分语音是否真实来自于用户或者客户就变得越来越重要。因此,如何对伪冒语音进行识别,是一个亟需解决的问题。
发明内容
本申请实施例的目的在于提出一种伪冒语音的识别方法、识别设备、计算机设备和计算机可读存储介质,以解决现有技术中,由于缺乏对伪冒语音的识别手段,而可能存在的安全漏洞问题。
为了解决上述技术问题,本申请实施例提供一种伪冒语音的识别方法、识别设备、计算机设备和计算机可读存储介质,采用了如下该的技术方案:
第一方面,本申请实施例提供了一种一种伪冒语音的识别方法,可以包括:
获取待识别语音;
对该待识别语音进行STFT变换处理,将该待识别语音转换为待识别语音信号特征图;
将该待识别语音信号特征图输入目标DenseNet网络模型,输出该待识别语音为真实语音或伪冒语音的二分类判别结果。
进一步地,该将该待识别语音信号特征图输入目标DenseNet网络模型之前,该识别方法还可以包括:
获取真实语音数据集和伪冒语音数据集;
利用STFT变换将该真实语音数据集中的语音转换为第一类别语音信号特征图,将该伪冒语音数据集中的语音转换为第二类别语音信号特征图,以得到可以包括该第一类别语音信号特征图和该第二类别语音信号特征图的第一语音信号特征图数据集;
利用该第一语音信号特征图数据集训练初始DenseNet网络,并基于损失函数对该初始DenseNet网络各层的权重参数进行调整,直至该损失函数小于小于预设值时,锁定该初始DenseNet网络各层的权重参数以得到该目标DenseNet网络模型。
进一步地,该利用STFT变换将该真实语音数据集中的语音转换为第一类别语音信号特征图,将该伪冒语音数据集中的语音转换为第二类别语音信号特征图,以得到可以包括该第一类别语音信号特征图和该第二类别语音信号特征图的第一语音信号特征图数据集之后,该识别方法还可以包括:
将该第一语音信号特征图数据集中部分语音信号特征图的部分频率特征执行遮掩操作,以将该第一语音信号特征图数据集转换为第二语音信号特征图数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010688484.9/2.html,转载请声明来源钻瓜专利网。





