[发明专利]一种方言语言的识别方法及虚拟现实教学方法和系统有效
申请号: | 201710708102.2 | 申请日: | 2017-08-17 |
公开(公告)号: | CN107452379B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 刘志 | 申请(专利权)人: | 广州腾猴科技有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/00;G10L17/26;G10L15/08;G10L15/10;G10L15/02;G10L25/03 |
代理公司: | 广州海心联合专利代理事务所(普通合伙) 44295 | 代理人: | 黄为;任琳 |
地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 方言 语言 识别 方法 虚拟现实 教学方法 系统 | ||
本发明公开了一种方言语言的识别方法及虚拟现实教学方法和系统,方言语言的识别方法包括以下处理步骤:通过口音特征提取模块对口音特征进行实时提取;口音特征分类模块根据提取的口音特征识别被采集者的口音所在地域和被采集者的性别,并且对被采集者的口音进行分类标注;口音识别模块根据被采集者的口音特征和所在区域及性别,从口音模型库中选择模型进行口音识别,将实时采集的语音数据转化成标准普通话;本发明还提供了一种虚拟现实教学方法和虚拟现实教学系统。在解决方言问题的同时提高识别精度、识别系统响应速度。
技术领域
本发明涉及语言识别领域,尤其涉及一种方言语言的识别方法,还涉及一种虚拟现实教学方法和一种虚拟现实教学系统。
背景技术
目前,虚拟现实技术在教育领域的应用已经引起了众多的关注。语音驱动课程已经开始成为虚拟现实教育技术的发展重点。按照控制方式进行划分有两种方式,分别是根据屏幕预留选项进行控制和输入语音来进行控制。根据屏幕预留选项进行控制的形式通过操纵杆等设备在用户眼前呈现的场景中进行选择,系统根据选择对象再映射成为课程关键词信息,从而进入预设的课程内容。但是该类方法存在着操作复杂并且所涉及的课程数量较少、不够智能化等问题。
输入语音来进行控制课程的形式主要是基于用户语音内容,然后通过提取语音中的关键词,并根据后台预设的关键词与课程进行关联关系,实现课程的展示。相对于前面的根据屏幕预留选项进行控制的方式而言,基于输入语音来进行控制的方式比较方便灵活,用户更加易于接受。但是该类方法同样存在识别精度不高、识别系统响应慢并且不能够识别带有方言口音的普通话等问题。
发明内容
本发明的目的一是,提供一种方言语言的识别方法,可以有效识别带有方言口音的普通话,帮助学生更好的学习、增加学习兴趣。
本发明的目的二是,提供一种虚拟现实教学方法。
本发明的目的三是,提供一种实现目的二方法的系统。
为实现该目的一,提供了一种方言语言的识别方法,该方法涉及到处理装置,该方法包括以下处理步骤:
步骤1:将实时采集的语音数据传递至口音特征提取模块,并且通过口音特征提取模块对口音特征进行实时提取;
步骤2:口音特征分类模块根据提取的口音特征识别被采集者的口音所在地域和被采集者的性别,并且对被采集者的口音进行分类标注;
步骤3:口音识别模块根据被采集者的口音特征和所在区域及性别,从口音模型库中选择模型进行口音识别,将实时采集的语音数据转化成标准普通话。
优选地,在步骤1中,口音特征提取模块对口音特征进行实时提取包括以下处理步骤:
步骤201:对语音声调特征的提取,
首先提高采集的语音数据的平滑度,其中提高语音平滑度的加重函数为:
H(z)=1-az-1
其中,H(z)表示加重函数,为预处理后输出的数据值;z表示采集的语音数据,a为平滑系数,a的范围是[0.91];
然后对提高了语音平滑度的语音数据进行用于提高抗干扰性强和抗衰减性的分帧处理,该分帧的函数为:
s-1(n)=w(n)×s(n)
其中,s(n)表示平滑后的语音数据,s-1(n)表示分帧后的语音数据,w(n)表示分帧函数,w(n)的定义如下:
其中,n表示对应语音帧的长度,N表示语音帧的总帧数;
步骤202:对语音能量值的提取,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州腾猴科技有限公司,未经广州腾猴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710708102.2/2.html,转载请声明来源钻瓜专利网。