[发明专利]一种基于Kinect视觉的唇读研究的方法在审

专利信息
申请号: 201811357055.2 申请日: 2018-11-15
公开(公告)号: CN111191490A 公开(公告)日: 2020-05-22
发明(设计)人: 喻梅;马权智;于健;于瑞国;王建荣;徐天一;赵满坤;高洁;岳帅 申请(专利权)人: 天津大学青岛海洋技术研究院
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32
代理公司: 暂无信息 代理人: 暂无信息
地址: 266200 山东省青岛市鳌*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 kinect 视觉 研究 方法
【权利要求书】:

1.一种基于Kinect视觉的唇读研究的方法,其特征在于:具体有以下步骤组成:

步骤一:通过Kinect采集所需脸部三维数据,并对数据进行预处理;

步骤二:定位唇区,提取唇部18个特征点,进行编号建模;

步骤三:提取特征,分别是特征点间的角度特征和特征点的坐标特征,并进行归一化处理;

步骤四:采用隐马尔可夫模型以及K-近邻算法对特征进行训练识别。

2.根据权利要求1所述的一种基于Kinect视觉的唇读研究的方法,其特征在于:步骤一对采集的数据进行了预处理,具体步骤如下:

通过采集获得语料库,将获取到的数据加标签及时间戳进行序列化,全部存到一个二进制文件中;将原始数据进行预处理,其一,要把整段音频进行切割,分成每个词一段音频,同时对应的彩色图像及深度数据也要同步的保存到同一位置;其二,我们需要将不合格的数据剔除,并进行重新补录。

3.根据权利要求1所述的一种基于Kinect视觉的唇读研究的方法,其特征在于:步骤二在步骤一的基础上进行唇区定位,具体步骤如下:

在数据采集阶段,利用Kinect传感器得到了说话人脸部预先定义的121个特征点的三维坐标信息;通过对数据进行大量实验,得到了唇部18个特征点所对应的脸部121个特征点的序号;根据18个点的位置关系,提取得到每个词的每帧图像对应的唇部所有特征点的三维坐标信息。

4.根据权利要求1所述的一种基于Kinect视觉的唇读研究的方法,其特征在于:步骤三在步骤一和步骤二的基础上进行特征提取,具体步骤如下:

有两种特征中可以选择,对应不同的选取及归一化方法;其一,是与传统的特征提取方式进行类比,以特征点间的角度作为特征,是使用K-近邻法选取得到;其二,是以唇部18个特征点的坐标直接作为特征,进行归一化之后进行训练识别。

5.根据权利要求1所述的一种基于Kinect视觉的唇读研究的方法,其特征在于:步骤四在步骤一、步骤二和步骤三的基础上对归一化的数据进行训练识别,具体步骤如下:

按照训练集和测试集配比为3:2以及全训练全识别的方式进行训练识别,训练识别的方式采用K-近邻法算法分类和HMM模型训练识别;通过比较识别结果与测试集的标签,可以得到识别率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学青岛海洋技术研究院,未经天津大学青岛海洋技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811357055.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top