[发明专利]一种基于声纹识别的S-T分类方法、装置及设备终端有效
| 申请号: | 201910798357.1 | 申请日: | 2019-08-27 |
| 公开(公告)号: | CN110544481B | 公开(公告)日: | 2022-09-20 |
| 发明(设计)人: | 陈增照;刘三女牙;刘桂麟;何秀玲;戴志诚;陈荣;张婧 | 申请(专利权)人: | 华中师范大学 |
| 主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/14;G10L17/22;G10L25/24 |
| 代理公司: | 武汉东喻专利代理事务所(普通合伙) 42224 | 代理人: | 赵伟 |
| 地址: | 430079 湖*** | 国省代码: | 湖北;42 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 声纹 识别 分类 方法 装置 设备 终端 | ||
本发明公开了一种基于声纹识别的S‑T分类方法、装置及设备终端,该方法包括:根据从目标语音样本数据中提取的声纹特征建立目标声纹标准模型;通过话语检测将待测的课堂语音数据分割为不同的语音片段,每个语音片段包含单一说话人的语音数据;将各语音片段与目标声纹标准模型进行匹配并计算相似性得分并将得分高于预设的得分阈值的语音片段判定为目标语音;本发明基于行为在时间维度进行连续抽样,通过话语检测分割出教师和学生各自话语行为的语音片段;根据采集数据分析教学模式,多维度可视化呈现教学过程中的行为数据;在收集数据时有更高的准确性,大大降低了采样时部分行为数据丢失的可能性,提高了后续模型匹配过程中的分类准确性。
技术领域
本发明属于教育信息技术领域,更具体地,涉及一种基于声纹识别的S-T分类方法、装置及设备终端。
背景技术
随着课程改革的不断深入,教学评价成为考察课堂教学成效的一个重要环节。话语作为课堂中知识传播的主要媒介,贯穿了整个教学活动。基于课堂话语对教学活动进行过程性评价,可以透视教学模式和策略,为教学反思提供科学的数据支持,有利于教师提升专业素养。
教学活动是一个复杂的过程,评价教学不能单凭研究者的主观感受,需要基于科学的量表再结合研究者在课堂中的观察实时记录,将复杂的教学活动量化,以得到一个科学、客观的评价结果。S-T分析法将课堂行为量化,以数理统计的方法对教学进行评价;其中S代表学生行为,T代表教师行为,研究者以一定的时间间隔(通常30s)观察记录此时间段所属教学行为类别,最终统计出T行为的占有率Rt和行为转换率Ch,以此为依据分析判断课堂的教学模式。S-T分析法将行为分为了两类,大大降低了分类的模糊性,使收集的数据更具有客观性,同时也增加了该方法的可操作性。
传统S-T分析从课堂话语角度观察课堂,编码课堂行为,量化分析教学活动;在实际应用中,S-T分析法也存在一些局限性。从时间维度上来说,它需要研究者进入课堂进行实时的课堂观察,研究者在课堂观察时的专注度不足和采样的时间间隔太长都可能造成部分行为数据不准确或丢失,从而对最终的分析结果产生影响。就空间维度而言,受限于时间和人力,S-T分析法也不易进行大规模课堂的采样分析。
随着信息技术在教育领域的发展和应用,研究人员提出了基于视频的改进型S-T分析法,该方法不再需要研究者实地进入课堂观察采样,而是通过课堂视频对课堂教学进行S-T分析。该方法基于行为抽样,直接标记某行为类别持续的时间,再对行为数据进行动态补偿以换算成S-T行为个数的序列。这种方法有效解决了传统S-T分析法以固定时间间隔采样时数据丢失的问题,也可以随时回溯教学过程,多次分析以避免数据采集的主观偏差,但该方法依然需要依靠人工来观察课堂视频,耗时耗力,不便开展大规模的S-T分析。另外,上述方法均需要提前对观察者进行培训以保证结果的可靠性,使得S-T分析法不能大规模应用于常规教学评价。为了解决这一问题,研究人员提出将图像识别和课堂教学视频相结合,通过图像识别技术判断当前时间段的教学行为。从效果上来看,该方法在一定程度上减少了人的工作量,但由于其对仅经过专业剪辑的课堂教学视频有较高的正确率,对常规的课堂实录视频,由于视频影像不能正确反映当前讲话人的身份,结果偏差较大,因此该方法的使用场景有较大局限性。
授权公告号CN105590632B的发明专利公开了一种基于语音相似性识别的S-T教学过程分析方法,该方法首先按照设定的抽样频率自动抽取数据,然后将抽取出的音频数据与目标声音进行相似性识别,从而判断是否与目标声音相似;该方法存在以下缺陷:一是不同的教学过程中教师行为与学生行为的分布不可能是单一固定的,按照固定频率进行抽样的方法导致抽取的音频数据既包括教师话语也包括学生话语,将其与目标声音进行相似性识别时根本无法准确判断所抽取音频数据的类别;二是抽样的每一话语片段内容不同、时长较短,直接计算语音相似度对于身份无关的其余信息(话语的内容、音调、音强)不具有抗干扰性,影响系统识别话语身份的准确性和鲁棒性。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中师范大学,未经华中师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910798357.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音识别资源切换方法和装置
- 下一篇:一种单通道语音分离系统





