[发明专利]一种基于虚拟现实的言语失用症康复训练方法在审
| 申请号: | 201910425523.3 | 申请日: | 2019-05-21 |
| 公开(公告)号: | CN110176284A | 公开(公告)日: | 2019-08-27 |
| 发明(设计)人: | 潘志庚;焦欢欢 | 申请(专利权)人: | 杭州师范大学 |
| 主分类号: | G16H20/00 | 分类号: | G16H20/00;G06F3/01;G10L15/02;G10L15/14 |
| 代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 朱月芬 |
| 地址: | 311121 浙江省杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 康复训练 虚拟场景 手柄 头显设备 计算机 头戴式显示器 画面传输 虚拟物品 虚拟现实 虚拟 语音 定位模块 反馈信息 分数信息 患者训练 实时获取 训练模块 治疗效果 内置 人嘴 发音 学习 | ||
1.一种基于虚拟现实的言语失用症康复训练方法,该方法采用的康复训练设备包括:
头显设备,包括头戴式显示器、与所述头戴式显示器无线交互的手柄;所述头戴式显示器和手柄均内置有定位模块,所述的定位模块用于空间内同时追踪头戴式显示器与手柄的定位;
计算机,与所述头显设备连接;计算机为头显设备提供康复训练虚拟场景的画面;
其特征在于,该方法的具体包括:
(1).计算机将言语失用症康复训练画面传输到头显设备,提供言语失用症康复训练虚拟场景,使用者用手柄在虚拟康复训练中与虚拟物品进行交互,学习虚拟场景中物品的发音,点击学习按钮进入学习模块虚拟场景;
(2).计算机将虚拟人嘴型画面传输到头显设备,提供学习的虚拟场景,使用者用语音在虚拟场景中与虚拟人进行交互,学习完成后,点击训练按钮进入训练模块虚拟场景;
使用者用语音在虚拟场景中与虚拟人进行交互,采用音素识别器将输入的语音转换为音素输入;所述的音素为语言的最小可分单元,采用实时音素识别器将输入的语音实时转换为音素;具体方法如下:
在语音识别系统中,一段语音信号经过特征提取后得到一个特征序列O=(o1,o2,…,oi),假定该特征帧序列对应的一个音素串为W=(ω1,ω2,…,ωn),那么连接语音识别的任务就是在语言L中找到与O对应的最可能音素串满足:
在基于隐马尔可夫模型语音识别中,使用Veterbi搜索算法,每处理一个特征序列即得到当前最佳的音素串,由式(1)得到t时刻的最佳音素串:
其中,ot为t时刻输入的特征帧,表示音素串的最后一个音素;由(s1)得到t+1时刻到t+N-1时刻的N-1个音素序列:
如果连续N个特征帧搜索到的最佳音素序列的最后一个音素都相同,设为并且与上一个已经识别输出的发音音素不同,那么将作为当前的发音音素输出,即如果t到t+N-1时刻得到的最佳音素序列满足:
则把当作当前正在发音的音素输出;
(3).计算机将训练画面传输到头显设备,提供训练的虚拟场景,使用者用语音在虚拟场景中与虚拟物品进行交互,获得训练分数信息,计算机实时获取头戴式显示器、手柄的反馈信息;
采用动态视素来描述某一视素发音时口型从产生到消失的完整变化过程:每个视素的每一个面部动画参数都定义一个控制函数,同时引入了两个无声模型以及他们各自的控制函数;p表示视素s的某一个面部动画参数,p在s中的控制函数Dsp表示为:
其中:αsp表示控制函数的峰值,θsp(-)、θsp(+)是衰减系数,c是常数,τ表示当前时刻到控制函数中心时刻的距离τ=ts0-t,ts0表示当前时刻;
两个无声模型分别表示无声到有声和有声到无声的口型转变;其中:
从无声到有声的控制函数为:
其中σ=tl0-t,tl0表示左无声模型中心的时刻;
从有声到无声的控制函数为:
其中v=tr0-t,tr0表示右无声模型中心的时刻;
任意时刻视素的动态参数由其静态值按照(s2)~(s4)表示的控制函数加权构成:其中:T0p为自然状态下中参数p的静态值;Tsp为视素s中参数p的静态值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910425523.3/1.html,转载请声明来源钻瓜专利网。





