[发明专利]一种语音分析方法和设备在审
| 申请号: | 202010444381.8 | 申请日: | 2020-05-22 |
| 公开(公告)号: | CN111613249A | 公开(公告)日: | 2020-09-01 |
| 发明(设计)人: | 李旭滨;范红亮 | 申请(专利权)人: | 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司 |
| 主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/51;G10L21/0272;G10L15/04 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100096 北京市海*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 语音 分析 方法 设备 | ||
1.一种语音分析方法,其特征在于,应用于单通道语音分析,该方法包括:
将待分析语音数据切分为语音部分与非语音部分;其中,所述待分析语音数据包括有多个发音人的语音数据;
将所述语音部分切分为多个语音片段;
对时间超过预设时长的语音片段进行聚类,以得到各所述语音片段的信息;
对确定了信息的各所述语音片段进行处理,确定多个所述发音人的语音特征;
将当前未进行处理且时间排序最前的语音片段与多个已处理的所述发音人的语音特征进行比对,确定当前进行比对的语音片段对应的发音人,并将当前进行比对的语音片段设置为已处理的语音片段。
2.如权利要求1所述一种语音分析方法,其特征在于,所述将待分析语音数据切分为语音部分与非语音部分,包括:
通过VAD方法对待分析语音数据进行切分,以将所述待分析语音数据分为语音部分与非语音部分。
3.如权利要求1所述的一种语音分析方法,其特征在于,所述将所述语音部分切分为多个语音片段,包括:
将所述语音部分按照预设时间长度切分为多个互不重叠的语音片段;
若时间最后的一个语音片段的时间长度小于预设值,则将时间最后的一个语音片段与相邻的语音片段进行合并。
4.如权利要求1所述一种语音分析方法,其特征在于,所述语音片段包括前后扩帧和/或overlap。
5.如权利要求1所述一种语音分析方法,其特征在于,所述预设时长对应的时间段中,所述待分析语音数据中每个发音人均进行了指定时长的语音。
6.如权利要求1所述一种语音分析方法,其特征在于,所述信息包括以下一个或多个的任意组合:特征、语音的发音人、语音的时间点。
7.如权利要求1所述的一种语音分析方法,其特征在于,所述对确定了信息的各所述语音片段进行处理,确定多个所述发音人的语音特征,包括:
对确定了信息的各所述语音片段通过平滑处理,将同属同一发音人的相邻语音片段合并,将预设语音片段对应的发音人设置为与相邻语音片段相同的发音人,以确定多个所述发音人的语音特征;
其中,所述预设语音片段处于前后相邻语音片段之间,且前后相邻语音片段对应的发音人相同,所述预设语音片段的时间长度小于预设时长。
8.一种语音分析设备,其特征在于,应用于单通道语音分析,该设备包括:
第一切分模块,用于将待分析语音数据切分为语音部分与非语音部分;其中,所述待分析语音数据包括有多个发音人的语音数据;
第二切分模块,用于将所述语音部分切分为多个语音片段;
聚类模块,用于对时间超过预设时长的语音片段进行聚类,以得到各所述语音片段的信息;
确定模块,用于对确定了信息的各所述语音片段进行处理,确定多个所述发音人的语音特征;
分析模块,用于将当前未进行处理且时间排序最前的语音片段与多个已处理的所述发音人的语音特征进行比对,确定当前进行比对的语音片段对应的发音人,并将当前进行比对的语音片段设置为已处理的语音片段。
9.如权利要求8所述一种语音分析设备,其特征在于,所述第一切分模块,用于:
通过VAD方法对待分析语音数据进行切分,以将所述待分析语音数据分为语音部分与非语音部分。
10.如权利要求8所述一种语音分析设备,其特征在于,所述第二切分模块,用于:
将所述语音部分按照预设时间长度切分为多个互不重叠的语音片段;
若时间最后的一个语音片段的时间长度小于预设值,则将时间最后的一个语音片段与相邻的语音片段进行合并。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云知声智能科技股份有限公司;厦门云知芯智能科技有限公司,未经云知声智能科技股份有限公司;厦门云知芯智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010444381.8/1.html,转载请声明来源钻瓜专利网。





