[发明专利]一种基于神经网络的唇语识别方法及系统在审

专利信息
申请号: 201811000489.7 申请日: 2018-08-30
公开(公告)号: CN109409195A 公开(公告)日: 2019-03-01
发明(设计)人: 杜吉祥;蔡微微;张洪博 申请(专利权)人: 华侨大学
主分类号: G06K9/00 分类号: G06K9/00
代理公司: 厦门智慧呈睿知识产权代理事务所(普通合伙) 35222 代理人: 郭福利
地址: 361000 福建*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 序列图像 唇部 唇语识别 神经网络 环境噪声干扰 学习 解码 记忆网络 时间空间 特征输入 特征序列 用户体验 准确率 视频
【说明书】:

发明公开了一种基于神经网络的唇语识别方法及系统。其中,所述方法包括:获取到唇部序列图像,进而从该获取到的唇部序列图像,提取出唇部序列图像的特征,进而将该提取出的唇部序列图像的特征输入到双向长短时记忆网络进行时间空间特征序列学习,并将该经学习后的唇部序列图像的特征进行训练,训练该经学习后的唇部序列图像的特征到唇语的识别模型,进而根据该训练该经学习后的唇部序列图像的特征到唇语的识别模型,对该提取出的唇部序列图像的特征进行解码识别,识别出唇语结果。通过上述方式,能够实现不受环境噪声干扰影响,对视频进行识别,识别出唇语结果,该识别出的唇语结果的准确率较高,用户体验较佳。

技术领域

本发明涉及唇语识别技术领域,尤其涉及一种基于神经网络的唇语识别方法及系统。

背景技术

随着人工智能技术的发展,复杂场景下音视觉混合的输入,单纯拼写的文字输入已是一种过去式,语音识别的比重逐渐提高,正在成为当下主流的自然交互方式。但是,单纯的语音交互易受环境影响,容易出现噪声干扰,比如说充满噪音的户外马路、在会议室里有他人说话的人声争执、车载场景下的发动机或空调噪声等等,都会大大减少语音识别的准确率,用户体验出现鲜明落差。

为了改善语音识别不准确的问题,出现了唇语识别技术。唇语识别技术是指通过对获取到的说话人的唇部动作等信息进行分析,识别出说话人所表达内容的方案。传统的唇语识别方案大多都包含嘴部检测、嘴部分割、嘴部归一化、特征提取和唇语分类器的构建,但是,传统的唇语识别方案的表现差强人意,唇语解读的准确率也就只有20%-60%,唇语识别结果的准确率低。

发明内容

有鉴于此,本发明的目的在于提出一种基于神经网络的唇语识别方法及系统,能够实现不受环境噪声干扰影响,对视频进行识别,识别出唇语结果,该识别出的唇语结果的准确率较高,用户体验较佳。

根据本发明的一个方面,提供一种基于神经网络的唇语识别方法,包括:

获取到唇部序列图像;

从所述获取到的唇部序列图像,提取出唇部序列图像的特征;

将所述提取出的唇部序列图像的特征输入到双向长短时记忆网络进行时间空间特征序列学习,并将所述经学习后的唇部序列图像的特征进行训练,训练所述经学习后的唇部序列图像的特征到唇语的识别模型;

根据所述训练所述经学习后的唇部序列图像的特征到唇语的识别模型,对所述提取出的唇部序列图像的特征进行解码识别,识别出唇语结果。

其中,所述获取到唇部序列图像,包括:

利用人脸检测和关键点检测方式,从图像序列中定位人脸,并检测人脸关键点,通过人脸关键点对唇部区域进行定位,获取到唇部序列图像;其中,人脸关键点包括能够表征人脸面部关键信息特征的位置。

其中,所述利用人脸检测和关键点检测方式,从图像序列中定位人脸,并检测人脸关键点,通过人脸关键点对唇部区域进行定位,获取到唇部序列图像,包括:

对初始的视频,利用人脸检测和关键点检测方式,从所述视频的图像序列中定位人脸,并检测人脸关键点,通过人脸关键点中的两嘴角关键点对唇部区域进行定位,并根据所述对唇部区域进行的定位和所述人脸关键点中的两嘴角关键点,计算出相对于标准嘴的平移和旋转因子,以及根据所述计算出的相对于标准嘴的平移和旋转因子,以两嘴角关键点的均值中心为图像中心分割得到所述唇部序列图像,获取到所述唇部序列图像。

其中,所述从所述获取到的唇部序列图像,提取出唇部序列图像的特征,包括:

对深度神经网络进行训练,应用所述经训练后的深度神经网络,按所述获取到的唇部序列图像的时间顺序,对所述获取到的唇部序列图像进行特征提取和特征拼接,从所述获取到的唇部序列图像,提取出唇部序列图像的特征。

其中,所述对深度神经网络进行训练,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华侨大学,未经华侨大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811000489.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top