[发明专利]一种快速动态手语识别算法的设计与实现在审

专利信息
申请号: 201810906565.4 申请日: 2018-08-10
公开(公告)号: CN109034093A 公开(公告)日: 2018-12-18
发明(设计)人: 霍艳;谭磊;曾维 申请(专利权)人: 成都理工大学
主分类号: G06K9/00 分类号: G06K9/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 610059 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 算法 快速动态 手语识别 硬件平台 手势 语音合成模块 读取 传感器采集 微处理模块 传输 测试模板 滤波处理 模板拷贝 匹配函数 手势模板 手势识别 手语数据 数据融合 文字信息 显示文字 语音播报 智能感知 主处理器 最小系统 数据处理 手语 处理器 内置 调用 打包 发送 返回
【说明书】:

发明方法属于智能感知领域。具体为一种快速动态手语识别算法的设计实现方法。本发明实现的硬件平台是以STM32F103RCT6最小系统作为处理器,μCOS系统作为平台,硬件平台内置ARM处理。本发明首先利用Baum‑Welch算法进行多次训练,为每个手势训练独立的HMM模型参数,得到稳定的测试模板,通过WIFI发送至PC端,接着将手语数据模板拷贝至能插到MCU上SDIO口的SD卡中,然后开始由各传感器采集各项数据,传输到微处理模块,经过数据融合、滤波处理,通过WiFi模块传输到主处理器中,进行数据处理、打包,再读取SD卡中的手势模板,最后调用匹配函数利用DTW和HMM算法进行手势识别,识别结束返回代表手势手语的函数值,一方面显示文字信息,在另一方面在语音合成模块将文字信息进行语音播报,从而实现整个识别过程。

技术领域

本发明方法属于智能感知领域。具体是通过优化、重构DTW和HMM算法,实现更适应较低时间复杂度和更具时空变化能力的算法,从而实现在动态情况下,快速准确地完成手语识别。

背景技术

随着计算能力的提高和科学技术的发展,手势识别技术的应用日益广泛。传统的手势识别技术在面对类别信息量大、环境较为复杂的情况时,识别效果往往很难令人满意。

根据最新我国人口普查公布的数据显示,在我们国家各类残疾人总数达到8500多万人,其中听力残疾人数约为2054万,言语残疾人数约为130万,分别占全国残疾人总数的24.16%和1.53%。在交流方面,存在语言沟通障碍的聋哑人只能通过手语进行相应的交流,他们与正常人的沟通存在极大的障碍。但是,根据现有市场调查发现,市面上目前存在的手语翻译设备,大多数是通过使用的摄像头或表面肌电传感器对手部姿态采集使用人的行为数据。然而,采用摄像头的设备存在处理数据量庞大、视觉死角和携带不便等缺点;采用表面肌电传感器设备则价格昂贵,多数聋哑人无法承担。事实上,这其实就是一种由手掌上各部位传感器取得的动态数据,经过一种综合了的复杂识别算法进行解析手语指令再与手势库进行匹配,再将信号经过转换进而得到语音或文字信息,其难点就在动态手语识别算法上。

动态手势的特征主要是轨迹,轨迹是空间位置坐标对时间的序列,同一个手势在时间序列上可能长短不一致,因此,采用动态时间规整算法可以很好的解决时间长度不一致的问题。

动态时间规整(DTW)是一个很著名的算法,早期应用于语音识别领域,至今为止已经在多个领域被广泛的应用。时间序列的概念在很多领域都有应用,而DTW基于动态规划思想,可以用于长度不一致的时间序列之间的相似度计算。DTW算法中的失真测量可以应用欧氏距离,也可以用对数似然比距离,算法简单、识别正确率高。

隐马尔可夫模型(HMM)算法是动态手势识别的一种经典算法,最早应用在语音识别领域,后在计算机图像处理和移动通信,生物信息等领域也得到广泛应用。该算法基于马尔可夫链模型,当前状态不能观察得到,而是通过之前的观测状态计算得到,每一个观测向量都是由一个状态序列表示,这个状态序列具有与观测向量相应的概率密度分布。马尔可夫模型参数可以采用离散概率分布函数,采用最大后验概率准则作为决策方法。隐马尔可夫算法被广泛应用在动态手势识别中,实时性好、正确率高。

虽然将DTW算法和HMM算法应用于动态手势识别中,识别的准确度和识别速度都会得到很大的提升,但将其运用到动态的手语识别中时,其计算量就十分巨大,搜索空间和路径复杂,算法优化如果不适当,则会影响算法解析指令实现的性能。尤其是在某些情况下,动态时间规整(DTW)这一算法尝试通过扭曲x轴来解释y轴上的变化,这将导致不自然的规整,使得时间序列曲线上的某一点映射到了另一条时间序列曲线上某一段较长的区间。

发明内容

本发明方法的目的是优化和重构一种识别算法,并根据这种算法寻找一种系统方案,解决目前在动态手语识别算法上的计算量大,识别度不够精确,识别速度低,识别算法功耗大、效率低,对移动平台适应性差等方面的问题。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都理工大学,未经成都理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810906565.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top