[发明专利]一种语音识别系统有效
申请号: | 202110124943.5 | 申请日: | 2021-01-29 |
公开(公告)号: | CN112885359B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 张喜云;李振新;闫晶;赵雷;韩娟娟;霍霄艳;李世伟;王康 | 申请(专利权)人: | 焦作大学 |
主分类号: | G10L17/04 | 分类号: | G10L17/04;G10L17/00;G10L17/18;G10L17/22 |
代理公司: | 成都其高专利代理事务所(特殊普通合伙) 51244 | 代理人: | 廖曾 |
地址: | 454000 河南省*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 识别 系统 | ||
1.一种用于教学的语音识别系统,其特征在于,该系统包括:
多个音频获取模块,多个音频获取模块同时获取环境中多个音频信息;
多个视频获取模块,获取环境中的多个视频信息;
音频处理模块,接收所述多个音频信息,根据所述多个音频信息中的声纹特征分离出个体声音,将所述个体声音分组并记录时间信息,将各分组中的个体声音进行融合得到个体增强音频信息;
定位模块,根据各分组中的个体声音中的时间信息结合音频获取模块的位置计算个体位置以辅助视频对个体定位;
分组模块,根据个体位置信息、声音强度分布、视频信息以及语义实现讨论分组,所述讨论分组中的语音采用所述个体增强音频信息;
教学交互模块,用于显示以及播放各个讨论分组语音;
视频处理模块,所述视频处理模块用于人像识别以及姿态识别并将带有标签信息的数据传输至分组模块;
所述分组模块还包括语义识别模块,所述语义识别模块包括语义理解模块和实时更新的扩展语义数据库,所述语义理解模块结合历史录取的个体语音中的语义信息进行训练,对照扩展语义数据库得出个体语义;语义识别模块还用于综合多个个体语音,以识别出两个及两个以上的对话对象;综合多个个体语音的优先级由个体位置信息、声音强度、视频信息确定,根据音频和视频中的时间标签信号确定个体是否面对以及声音强度是否足够能够被对话对象获取,再根据语义识别模块中多个个体语音进行语义分析以识别出两个及两个以上的对话对象;
所述的语音识别系统采用以下识别方法,该识别方法包括如下步骤:
S1、获取环境中多个不同位置的音频信息;
S2、根据所述多个不同位置的音频信息中的声纹特征分离出个体声音,将所述个体声音分组并记录时间信息,将各分组中的个体声音进行融合得到个体增强音频信息;个体声音分组是指,将分离出的多个个体声音进行分组并赋予时间标签;个体声音融合方法具体为:将各个分组中的相同个体声音根据频谱信息进行融合;分离出个体声音的方法具体可为:预先采集个体声音信息,存储并进行语音建模为分离模型;根据个体声音与分离模型进行比较进行相似度运算以实现个体声音分辨,然后将个体声音从环境音中提取出来,提取方法具体可为根据频谱信息训练得到的神经网络滤波算法;
S3、根据各分组中的个体声音中的时间信息结合音频获取模块的位置计算个体位置以辅助视频信息对个体定位;个体位置定位方法根据接收到的个体声音的飞行时间计算得到,然后根据定位位置视频中的人脸识别模块进一步验证个体声音身份;以提升识别准确度;
S4、根据个体位置信息、声音强度分布、视频信息以及语义实现讨论分组;所述步骤S4中的实现讨论分组的具体方法为:
1)建立个体位置分布图;
2)建立声音强度分布,结合个体位置分布图再根据声音强度所能到达的位置确定分组可能对象;
3)识别视频信息中的说话者和倾听者,再结合步骤2)中的分组可能对象的个体声音语义确定讨论分组个体;
上述讨论分组能够动态确定分组讨论人员以及讨论内容的关联,能够实时动态确定分组,并能够确定分组讨论内容以便后续处理;
S5、显示和播放讨论分组中的个体增强音频信息;
所述S5中的显示和播放讨论分组中的个体增强音频信息方法具体为:将所述S4中的讨论分组根据讨论内容显示在教学终端中,点击某一讨论分组打开分组讨论内容,所述分组讨论内容中包括讨论分组个体在S2中得到的个体增强音频信息;可实现分组讨论信息的记载并回放信息,使得教学人员能够同时获得不同分组讨论信息,更利于开展讨论课教学,不会忽视某一群体或者某一个体。
2.根据权利要求1所述的系统,其特征在于,所述音频获取模块设置在不同位置。
3.根据权利要求1所述的系统,其特征在于,所述音频处理模块包括:分布式音频接收模块、分布式声纹识别模块以及声音融合模块,所述分布式音频接收模块能够并行接收多个音频获取模块中的音频信息,所述声纹识别模块能够识别音频信息并分离出个体声音;多个所述声纹识别模块分别识别多个音频获取模块中的音频信息;所述声音融合模块将相同个体的个体声音融合。
4.根据权利要求1所述的系统,其特征在于,所述分组模块还包括声音强度分布计算模块,根据不同分组中的个体声音计算得到声音强度分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦作大学,未经焦作大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110124943.5/1.html,转载请声明来源钻瓜专利网。