[发明专利]基于声纹识别、人脸识别以及同步活体检测的身份认证方法及系统在审
申请号: | 201510811908.5 | 申请日: | 2015-11-20 |
公开(公告)号: | CN105426723A | 公开(公告)日: | 2016-03-23 |
发明(设计)人: | 郑方;李蓝天;邬晓钧;王刚;陈柳村;瞿世才;刘乐;王小钢;郝明涛 | 申请(专利权)人: | 北京得意音通技术有限责任公司;清华大学 |
主分类号: | G06F21/32 | 分类号: | G06F21/32 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苏培华 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 声纹 识别 以及 同步 活体 检测 身份 认证 方法 系统 | ||
技术领域
本申请涉及计算机信息服务技术领域,特别是涉及一种基于声纹识别、人脸识别以及同步活体检测的身份认证方法及系统。
背景技术
随着移动互联网的高速发展以及手持终端设备如智能手机、平板电脑的普及,互联网安全问题日益突出。目前,无论是银行的硬件数字证书还是动态口令牌,都只做到了对可信终端的管理,无法对用户身份进行验证。
近几年,随着公众账户安全性意识的提高,现有技术常采用单一生物特征技术实现对账户的身份验证,但是单一生物特征技术对重复录音、模仿及合成的语音闯入识别性能不是很好,并且在对安全性要求较高的场合单独使用单一生物特征认证存在一定的风险。例如,采用人脸技术实现对身份的验证,但是由于人脸的外形很不稳定,人可以通过脸部变化产生各种表情;此外,不同的观测角度和光照条件,人脸的视觉图像也相差较大。因此,当闯入者利用高像素图像闯入人脸识别系统,此时人脸识别系统通过了验证,但是实际上该闯入者是非法用户,从而给用户带来了安全隐患。
发明内容
本申请提供一种基于声纹识别、人脸识别以及同步活体检测的身份认证方法及系统,以解决身份识别不准确和安全性差的问题。
为了解决上述问题,本申请公开了一种基于声纹识别、人脸识别以及活体检测的身份认证方法,包括:获取使用者的语音信号和视频信号;
对所述语音信号和视频信号进行活体检测,获得活体检测结果;
若所述活体检测结果大于第一设定阈值,则对获取使用者的语音信号和视频信号进行声纹识别和人脸识别:若声纹识别和人脸识别全部通过,则身份认证通过,否则身份认证失败。
优选地,所述活体检测包括语音识别和唇语识别。
优选地,所述对所述语音信号和视频信号进行活体检测,获得活体检测结果的步骤包括:
对所述语音信号进行语音识别,获得语音信号对应的语言信息;
对所述视频信号进行分帧处理,获得分帧后的每帧图像中的嘴唇位置;
对所述每帧图像中的嘴唇位置进行唇语识别,获得每帧图像的唇语对应的语言信息;
使用时间对准算法计算语音信号对应的语言信息与唇语识别对应的语言信息的相似度值,将所述相似度值作为活体检测结果。
优选地,所述对获取使用者的语音信号和视频信号进行声纹识别和人脸识别的步骤包括:
对使用者的语音信号进行声纹识别,得到语音信号的声纹识别打分;
对使用者的人脸视频图像,进行分帧,获取人脸连续帧图像,对所述人脸连续帧图像进行人脸识别,对获得的人脸识别进行分数融合,得到人脸识别打分;
根据所述声纹识别打分和人脸识别打分,获得使用者身份认证的判决得分;
若所述判决得分大于第二设定阈值,则使用者身份认证成功;
若所述判决得分小于第二设定阈值,则使用者身份认证失败。
优选地,还包括:使用视频图像采集器获取使用者视频信号,使用语音采集器获取使用者的语音信号。
为了解决上述问题,本申请还公开了一种基于声纹识别、人脸识别以及活体检测的身份认证系统,包括:获取模块,用于获取使用者的语音信号和视频信号;
活体检测模块,用于对所述语音信号和视频信号进行活体检测,获得活体检测结果;
第一判断模块,用于若所述活体检测结果大于第一设定阈值,则对获取使用者的语音信号和视频信号进行声纹识别和人脸识别;若声纹识别和人脸识别全部通过,则身份认证通过,否则身份认证失败。
优选地,所述活体检测包括语音识别和唇语识别。
优选地,活体检测模块包括:
语音识别模块,用于对所述语音信号进行语音识别,获得语音信号对应的语言信息;
分帧模块,用于对所述视频信号进行分帧处理,获得分帧后的每帧图像中的嘴唇位置;
唇语识别模块,用于对所述每帧图像中的嘴唇位置进行唇语识别,获得每帧图像的唇语识别对应的语言信息;
计算模块,用于使用时间对准算法计算语音信号对应的语言信息与唇语识别对应的语言信息的相似度值,将所述相似度值作为活体检测结果。
优选地,判断模块包括:
声纹识别模块,用于对使用者的语音信号进行声纹识别,得到语音信号的声纹识别打分;
人脸识别模块,用于对使用者的人脸视频图像,进行分帧,获取人脸连续帧图像,对所述人脸连续帧图像进行人脸识别,对获得的人脸识别进行分数融合,得到人脸识别打分;
判决模块,用于根据所述声纹识别打分和人脸识别打分,获得使用者身份认证的判决得分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京得意音通技术有限责任公司;清华大学,未经北京得意音通技术有限责任公司;清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510811908.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电子设备及其屏幕的解锁方法
- 下一篇:盗版应用检测方法和装置、系统