[发明专利]基于角色识别的语音识别系统有效
申请号: | 202110347499.3 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113096669B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 黄星耀;熊倩;王枫;王学春;张志亮 | 申请(专利权)人: | 重庆风云际会智慧科技有限公司 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/14;G10L15/26;G06K9/62 |
代理公司: | 重庆强大凯创专利代理事务所(普通合伙) 50217 | 代理人: | 赵玉乾 |
地址: | 400000 重庆市璧山区璧泉街道*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 角色 识别 语音 系统 | ||
1.基于角色识别的语音识别系统,其特征在于,包括:
采集模块,用于采集谈话人与被谈话人的谈话语音;
提取模块,用于根据谈话语音提取声纹特征;
聚类模块,用于对声纹特征进行聚类,将声纹特征分为谈话人对应的第一特征与被谈话人对应的第二特征,并根据第一特征与第二特征将谈话语音分为谈话人对应的第一语音与被谈话人对应的第二语音;
纠正模块,用于采用TDOA算法计算第一语音中各个音频片段的第一时延,采用TDOA算法计算第二语音中各个音频片段的第二时延,计算第一时延的标准差与第二时延的标准差,并判断第一时延的标准差与第二时延的标准差是否均小于时延阈值:如果第一时延的标准差与第二时延的标准差均小于时延阈值,发送输出结果的指令到输出模块;反之,发送重新聚类的指令到聚类模块;
输出模块,用于输出第一语音与第二语音。
2.如权利要求1所述的基于角色识别的语音识别系统,其特征在于,纠正模块还用于采用TDOA算法根据第一时延计算第一距离,采用TDOA算法根据第二时延计算第二距离,并判断第一距离的标准差与第二距离的标准差是否均小于距离阈值:如果第一距离的标准差与第二距离的标准差均小于距离阈值,发送输出结果的指令到输出模块;反之,发送重新聚类的指令到聚类模块。
3.如权利要求2所述的基于角色识别的语音识别系统,其特征在于,纠正模块还用于在采用TDOA算法计算第一语音中各个音频片段的第一时延之前,对第一语音进行增益处理;在采用TDOA算法计算第二语音中各个音频片段的第二时延之前,对第二语音进行增益处理。
4.如权利要求3所述的基于角色识别的语音识别系统,其特征在于,纠正模块还用于在采用TDOA算法计算第一语音中各个音频片段的第一时延之前,对第一语音进行回音消除处理;在采用TDOA算法计算第二语音中各个音频片段的第二时延之前,对第二语音进行回音消除处理。
5.如权利要求4所述的基于角色识别的语音识别系统,其特征在于,纠正模块还用于在采用TDOA算法计算第一语音中各个音频片段的第一时延之前,对第一语音进行降噪处理;在采用TDOA算法计算第二语音中各个音频片段的第二时延之前,对第二语音进行降噪处理。
6.如权利要求5所述的基于角色识别的语音识别系统,其特征在于,输出模块还用于将第一语音转换为第一文本,并将第二语音转换为第二文本。
7.如权利要求6所述的基于角色识别的语音识别系统,其特征在于,输出模块还用于同步显示第一文本与第二文本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆风云际会智慧科技有限公司,未经重庆风云际会智慧科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110347499.3/1.html,转载请声明来源钻瓜专利网。