[发明专利]一种肢体康复设备语音交互控制方法在审
申请号: | 202011185814.9 | 申请日: | 2020-10-29 |
公开(公告)号: | CN112365890A | 公开(公告)日: | 2021-02-12 |
发明(设计)人: | 张延恒;康少琦;张莹 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/26;G10L15/34;G10L21/02;G10L21/0216 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 肢体 康复 设备 语音 交互 控制 方法 | ||
本发明公开了一种肢体康复设备语音交互控制方法,包括特殊设计的语音控制命令库和语音交互控制算法。所述的特殊设计的语音控制命令库是包括语义命令字段和语音验证码字段的语音控制命令字段;所述语音交互控制算法是包括利用麦克风获取患者带噪语音命令、利用语音分离算法提取出较纯净的语音命令的语音分离方法;利用云端语音识别算法识别语音命令、识别结果反馈回本地进行后续处理的语音识别方法;利用信息抽取算法抽取语音命令中包含的患者信息、运动信息、以及语音验证码信息的语义分析方法。本发明能够让脑卒中患者进行自主控制操作的一种肢体康复设备语音交互控制方法,并利用语音语义识别分析技术,在保证可靠性要求的前提下,提高语音控制的效率,增加康复治疗的交互性,使康复效果得到提高。
技术领域
本发明涉及语音语义识别和分析技术领域,特别涉及适用于肢体康复设备的语音控制交互系统。
背景技术
语音识别技术可以将自然语音识别并转化为字符串,将字符串进行语义层面的分析可以获得语音的实际意义。合理的利用语音语义识别分析技术,可以实现患者对康复设备的自主操作。传统的语音交互控制类产品,由于待识别语音范围广,语音命令无限制且没有验证方法,导致其不能稳定高效的实现自然语音的识别,将这类传统产品或方法直接应用于康复医疗领域,存在很多不可靠的因素,因此,设计一种针对肢体康复设备的语音交互控制方法是很有必要的。考虑到传统方法的局限性,以及康复设备的使用特性,新的方法应该从语音识别范围上加以限制,并设计一种简便的可以用于验证语音命令的验证码,配合硬件和算法进行语音的分离降噪,以满足患者使用康复设备时的可靠性要求。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,制定一套能够让脑卒中患者进行自主控制操作的一种肢体康复设备语音交互控制方法,并利用语音语义识别分析技术,在保证可靠性要求的前提下,提高语音控制的效率,增加康复治疗的交互性,使康复效果得到提高。
本发明通过以下技术方案实现上述目的:该技术方案包括特殊设计的语音控制命令库和语音交互控制算法;所述的特殊设计的语音控制命令库包含一系列语音控制命令字段;所述的语音控制命令字段包括语义命令字段和语音验证码字段;所述的语义命令字段包含运动动作和运动参数两部分,基于肢体康复设备的运动,结合医学用语、生活口语进行设计,基于使用场景进行测试;所述肢体康复设备的运动包括但不限于腿部、臂部、手部等康复运动;所述生活口语包括语序倒装、发音非标准化现象;所述使用场景,包括家庭室内场景、医院康复中心场景等,主要考虑该场景下的噪声特性,包括静音环境、低噪声环境、高噪声环境等,测试方法为将音乐、朗诵、高斯白噪声等不同类型的噪声,以20%、40%、60%、80%的噪声能量比混入待测试语义命令中,测试该命令的语音识别准确度,结果评价以识别结果中的字词错误率为主;所述的语音验证码字段是基于运动部位、运动类别、运动参数信息进行设计的,与语义命令字段一一对应;语音验证码的第一位根据运动部位的不同进行编号,语音验证码的第二位根据具体动作的不同进行编号,语音验证码的后续位数字表示运动参数,语音验证码一般是但不限于四位数字;所述的语音交互控制算法包括语音分离算法、语音识别算法、语义分析算法;所述语音分离方法为利用麦克风获取患者带噪语音命令、利用语音分离算法提取出较纯净的语音命令;所述语音识别方法为利用云端语音识别算法识别语音命令、识别结果反馈回本地进行后续处理;所述语义分析方法为利用信息抽取算法抽取语音命令中包含的患者信息、运动信息、以及语音验证码信息;所述的信息抽取算法为利用BERT预训练模型对新闻文本训练集与医疗文本数据集进行预训练,在得到预训练结果后,对包含标注信息的口语化语音控制命令文本数据集进行迁移学习和微调,使计算机可以准确识别出患者语音中包含的语音控制命令;所述的口语化语音控制命令文本数据集是指将上述语音控制命令用口语化的方式表达后产生的文本数据集。所述的一种肢体康复设备语音交互控制方法包括以下步骤:
S1、通过麦克风获取患者口述的带噪语音控制命令字段;
S2、带噪患者语音经过语音分离算法处理减弱噪声,获得较为纯净的患者语音;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011185814.9/2.html,转载请声明来源钻瓜专利网。