[发明专利]嘴唇轮廓的定位方法在审

专利信息
申请号: 201610049810.5 申请日: 2016-01-26
公开(公告)号: CN106997451A 公开(公告)日: 2017-08-01
发明(设计)人: 鲁远耀;卢开宏;周腾鹤;王景中;肖珂 申请(专利权)人: 北方工业大学
主分类号: G06K9/00 分类号: G06K9/00
代理公司: 北京安博达知识产权代理有限公司11271 代理人: 徐国文
地址: 100041 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 嘴唇 轮廓 定位 方法
【说明书】:

技术领域

发明涉及图像处理与模式识别领域,尤其涉及一种嘴唇轮廓的定位方法。

背景技术

当今社会,随着计算机的出现和逐步的普及,人们对信息的需求量呈现出几何级数的增长,其中信息互换的主要方式之一就是通过语音的交流。在噪声环境下,人们对语音信息的感知程度受到干扰而大幅下降,语音交流方式此时便显得有些捉襟见肘。近些年来,图像处理和模式识别技术的兴起,使得计算机视觉技术受到研究人员的普遍关注,经过大量探索和分析发现,唇形及其动态特征在人类感知语言的过程中起着重要作用,分析讲话者的唇形特征是可以理解或者部分理解其讲话内容的,利用人说话时嘴唇的动态视觉信息来进行语言识别在现阶段以及今后一段时间的研究当中具有非常重要的理论意义和广泛的应用前景。

与基于音频信息的语音识别不同,基于唇动视觉特征的语言识别是一个非常前沿的研究方向,是一种全新的研究观点和探索方法,具有很强的新颖性和前瞻性。让机器听懂人说的话,即基于音频进行语音识别的领域已经有很多研究者进行过探索,并且取得了非常好的成果,在相对比较理想的条件下,识别率非常高,基本已经达到实用程度。然而,在很多实际生活中的应用场合,比如地铁站、机场、工作车间、办公室、车站、以及公共汽车上等场合,总会存在不同程度的干扰噪声,这些噪声的来源随机广泛,形式也多种多样。由于基于音频的语言识别系统采用的方法主要是基于统计的方法,其模型在训练的时候很难把所有干扰噪声的特性和类型都不考虑进来,因此在识别这些叠加有噪声污染的语音信号时,系统性能会急剧下降,所得到的识别结果也可能不尽如人意。为了使语言识别技术能够更加广泛地应用于各种实际的场合,就必须提高识别系统对信息采集时环境中噪声的鲁棒性。这些方面的研究在理论研究和实际应用方面都有着很多难度很大,甚至是难以克服的瓶颈问题。

为了克服单纯依靠声音信息进行语音识别时可能存在的缺陷和不足,一些研究者们提出了一些可能提高语言识别性能的解决方案。从日常生活人和人之间的谈话中,听话者对说话者语言信息的获取过程和获取方式受到启发,与话语的声音信息相对应的嘴唇 的视觉信息同样能够对人们更好地理解说话人的语言中所包含的信息有所帮助,尤其是对于听力功能有一定障碍的听话者来说,应用说话者表情和嘴唇所提供的语言视觉信息作为话语的补充,甚至是完全依靠(对于完全耳聋的人)说话者的表情和嘴唇的视觉信息,来理解说话者话语中所表达的信息显得尤为重要。基于这一系列事实,研究者们通过在依靠音频的语音识别系统中加入了说话者的表情和嘴唇动作等一些视觉方面的信息,把它作为声音信息的补偿,也就是基于音视频的双模态语音识别,这些方案在提高语音识别的准确率上起到了一定的效果。

然而当前一些研究在嘴唇分割方面缺乏高效和准确性,使得对嘴唇信息的特征提取效能大打折扣,导致最终的识别结果始终不尽如人意,识别率无法得到保障。

发明内容

有鉴于此,本发明的目的在于提供一种能够提高定位准确度的嘴唇轮廓定位方法。为了对披露的实施例的一些方面有一个基本的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。

一种嘴唇轮廓的定位方法,包括如下步骤:

对嘴唇区域进行粗分割,以得到嘴唇区域二值化图像;

将嘴唇区域二值化图像转换为灰度图像,在嘴唇区域灰度图像中查找嘴角关键点,所述嘴角关键点包括左、右嘴角关键点;

以嘴角关键点为基准,查找嘴唇内、外轮廓关键点,从而完成嘴唇轮廓的定位;所述嘴唇内轮廓关键点包括上、下嘴唇内轮廓关键点,所述外轮廓关键点包括上、下嘴唇外轮廓关键点。

在一些可选的实施例中,对嘴唇区域进行粗分割,通过下述方式实现:

将嘴唇区域图像从当前颜色空间转换为另两种颜色空间;

利用转换后两种颜色空间的分量获取相应直方图,对两幅直方图均衡化后再进行二值化,将二值化的两幅图像进行逻辑与运算得到嘴唇区域二值化图像;

提取嘴唇区域二值化图像的最大连通域并进行闭运算处理,从而实现嘴唇区域的粗分割。

在一些可选的实施例中,查找嘴角关键点,通过下述方式实现:

对嘴唇区域灰度图像进行行扫描,找出像素点灰度值之和最小的一行作为搜索嘴角的参考行;

以参考行为基础,上下各扩展N行所形成的带状区域即为嘴角搜索域,所述N为不小于5的整数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北方工业大学,未经北方工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610049810.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top