[发明专利]一种中文鼻韵母发音障碍患者的判断装置的使用方法在审
申请号: | 201710584811.4 | 申请日: | 2017-07-18 |
公开(公告)号: | CN107452370A | 公开(公告)日: | 2017-12-08 |
发明(设计)人: | 白静;王晴;薛珮芸;张雪英;冯沛 | 申请(专利权)人: | 太原理工大学 |
主分类号: | G10L15/01 | 分类号: | G10L15/01;G10L25/72;A61B5/00;G09B5/04 |
代理公司: | 太原市科瑞达专利代理有限公司14101 | 代理人: | 李富元 |
地址: | 030024 山西*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 中文 鼻韵母 发音 障碍 患者 判断 装置 使用方法 | ||
技术领域
本发明涉及听障患者病理语音研究领域。
背景技术
据数据显示,我国听力语言残疾居视力残疾、肢残、智残等五大残疾之首,约2780万人(含多重),占我国残疾人口总数的33.51%。据统计,我国聋哑症的发病率约为2‰,每年约新增3万听力损害的新生儿。听障患者普遍存在前后鼻韵母混淆、韵头或者韵腹元音发音不到位等问题,直接影响其言语清晰度,进而无法正常地与社会沟通交流,因此对听障患者鼻韵母的发音研究十分重要。
作者张珑等人在文献《汉语普通话水平测试中儿化音的自动检测与评价》中,提出一种汉语普通话水平测试中儿化音的自动检测与评价方法,该方法是基于语音的声学特征进行的评估方法。该实验选用CCTV实验室录制的新闻联播中2位说话人(一男一女)的语音数据作为标准数据集,包括36个儿化韵母和1488 个双音节儿化词语。选择某高校国家普通话水平考试的现场语音为测试数据集,共89名学生,包括100个单音节字和50多个多音节词。作者采用时长、音节类别、置信度、基频、能量、音强和共振峰等声学特征,分别选择分类回归树(CART)、神经网络(NN)、支持向量机和集成分类回归树(Boosting CART)作为分类模型对实验样本进行分类。该方法可实现对儿化音的分类检测,其中集成分类回归树模型分类正确率最高,达到92.41%。但文章所采用的特征都来自于语音的声学特征,缺少发音时生理运动特征,不够全面。
作者肖彦等人在文献《腭裂语音中齿龈塞音的声门代偿现象声学分析与判定》中,通过分析齿龈塞音的频谱分布的多阶统计量谱矩,将代偿塞音与正常塞音进行对比,同时实现对普通话/di/的声门塞音客观判定。作者选用52位腭裂发音人(37 男性15女性)和26位腭裂康复发音人(17男性9女性)为实验对象,采集其4 个塞音(/b p d t/),6个塞擦音(/zh ch z c j q/),4个擦音(/s sh x h/)与3个单元音(/a u i/)的组合,共有29个音节。提取所得语音的4个特征:质心(一阶谱矩)方差(二阶谱矩)偏度(三阶谱矩)峰度(四阶谱矩)进行分析。以/di/ 为例,采用逻辑回归模型进行样本分类,通过交叉验证选出最优的四阶谱矩作为模型自变量,分类正确率为89.7%。但是上述研究的分析对象都不是听障患者,并且仅采用了声学特征——谱矩进行分析,相对单一。
发明内容
本发明所要解决的技术问题是:如何解决背景技术中存在的问题。
本发明所采用的技术方案是:一种中文鼻韵母发音障碍患者的判断装置的使用方法,该鼻韵母发音障碍患者的判断装置包括三维电磁发音仪、处理芯片、音响设备,使用过程按照如下步骤进行:
步骤一、在处理芯片中建立正常人和鼻韵母发音障碍患者标准置信区间数据库,选择多个正常人和多个鼻韵母发音障碍患者阅读同样的鼻韵母发音语料,通过三维电磁发音仪记录每个阅读者在阅读每个鼻韵母发音语料时的时长,求得所有正常人在阅读每个鼻韵母发音语料时的置信水平为95%的置信区间,建立正常人标准置信区间数据库求得所有鼻韵母发音障碍患者在阅读每个鼻韵母发音语料时的置信水平为95%的置信区间,建立鼻韵母发音障碍患者标准置信区间数据库其中,a表示正常人,b表示鼻韵母发音障碍患者,n表示对应鼻韵母发音语料/ang/、/eng/、/in/、/ing/;
步骤二、通过三维电磁发音仪记录待测者在阅读每个鼻韵母发音语料时的运动特征参数,检测待测者在阅读每个鼻韵母发音语料时的时长落入正常人标准置信区间数据库和鼻韵母发音障碍患者标准置信区间数据库中的个数,如果全部落入正常人标准置信区间数据库中,说明待测者发音完全没有问题,处理芯片控制音响设备发出待测者发音完全正确提示;如果全部落入鼻韵母发音障碍患者标准置信区间数据库中,说明是标准鼻韵母发音障碍患者,处理芯片控制音响设备发出待测者是鼻韵母发音障碍患者提示;其他情况说明待测者是轻度鼻韵母发音障碍患者,处理芯片控制音响设备发出待测者是轻度鼻韵母发音障碍患者提示。
作为一种优选方式:发音过程中,发音时舌头开始动作的时间点为起点,发音结束后舌头停止动作的时间点为终点,时长为起点至终点间的时段。
本发明的有益效果是:本发明通过ang_时长、eng_时长、in_时长、ing_时长对待测者进行检测,特征组合正确率为93.75%左右。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原理工大学,未经太原理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710584811.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音合成模型生成方法和装置
- 下一篇:远场语音识别模型的训练方法和装置