[发明专利]一种基于声纹的语音识别方法有效
申请号: | 202110124834.3 | 申请日: | 2021-01-29 |
公开(公告)号: | CN112885356B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 张喜云;李振新;霍霄艳;闫晶;韩娟娟;赵雷;王康 | 申请(专利权)人: | 焦作大学 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/18;G10L17/20;G10L17/22;G10L21/0272 |
代理公司: | 成都其高专利代理事务所(特殊普通合伙) 51244 | 代理人: | 廖曾 |
地址: | 454000 河南省*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 声纹 语音 识别 方法 | ||
1.一种基于声纹的教学语音识别方法,其特征在于,该方法包括如下步骤:
S1、获取环境中多个不同位置的音频信息;
S2、根据所述多个不同位置的音频信息中的声纹特征分离出个体声音,将所述个体声音分组并记录时间信息,将各分组中的个体声音进行融合得到个体增强音频信息;
S3、根据各分组中的个体声音中的时间信息结合音频获取模块的位置计算个体位置以辅助视频信息对个体定位;
S4、根据个体位置信息、声音强度分布、视频信息以及语义实现讨论分组;所述步骤S4中的实现讨论分组的具体方法为:
1)建立个体位置分布图;
2)建立声音强度分布,结合个体位置分布图再根据声音强度所能到达的位置确定分组可能对象;
3)识别视频信息中的说话者和倾听者,再结合步骤2)中的分组可能对象的个体声音语义确定讨论分组个体;
S5、显示和播放讨论分组中的个体增强音频信息。
2.根据权利要求1所述的基于声纹的教学语音识别方法,其特征在于,所述步骤S2中的分离出个体声音的方法为:预先采集个体声音信息,存储并进行语音建模为分离模型。
3.根据权利要求1所述的基于声纹的教学语音识别方法,其特征在于,所述步骤S2中的个体声音分组是指将分离出的多个个体声音进行分组并赋予时间标签。
4.根据权利要求1所述的基于声纹的教学语音识别方法,其特征在于,所述步骤S2中的个体声音融合方法为将各个分组中的相同个体声音根据频谱信息进行融合。
5.根据权利要求1所述的基于声纹的教学语音识别方法,其特征在于,所述步骤S3中的个体位置定位方法根据接收到的个体声音的飞行时间计算得到。
6.根据权利要求2所述的基于声纹的教学语音识别方法,其特征在于,根据个体声音与分离模型进行比较进行相似度运算以实现个体声音分辨,然后将个体声音从环境音中提取出来。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦作大学,未经焦作大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110124834.3/1.html,转载请声明来源钻瓜专利网。