[发明专利]一种说话人分段聚类方法及装置有效
申请号: | 201910015449.8 | 申请日: | 2019-01-08 |
公开(公告)号: | CN109859742B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 袁庆升;包秀国;汪立东;张鸿;杜翠兰;王文超;颜永红;陈志高 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心;中国科学院声学研究所 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/04;G10L15/06;G10L15/26;G10L25/51 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 李勤媛 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 说话 分段 方法 装置 | ||
本发明提供一种说话人分段聚类方法及装置,以解决相关技术中处理短时说话人语音时,性能下降导致说话人聚类效果较差的问题。该方法包括:将待聚类语音划分为多个子语音段;通过权重联合概率线性判别分析WT‑PLDA模型对基于划分得到的各子语音段的I‑vector提取出各子语音段的特征信息W‑vector,所述WT‑PLDA模型的模型参数至少包括:均值向量、说话人子空间的投影矩阵、说话人因子的隐藏变量以及残差因子;通过概率线性判别分析PLDA根据划分后多个子语音段的所述W‑vector对该多个子语音段循环进行多次聚类,直至所述多个子语音段被聚类为两类。本发明提高了说话人的聚类效果。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种说话人分段聚类方法及装置。
背景技术
总变化因子分析技术不区分说话人和信道信息,而是将GMM(高斯混合模型)均值超向量中的说话人变化空间和信道变化空间合并为总变化空间来进行建模。给定一个GMM均值超向量M,总变化因子分析中假设它能被分解如下:
M=m+Tw;
其中,m表示UBM的均值超向量,T表示总变化空间矩阵,w是低维的总变化因子向量。w服从标准高斯分布,即:f(w)=N(w|0,I)。总变化因子分析中不区分说话人变化和信道变化性,总变化因子向量同时包含GMM均值超向量中的说话人信息和信道信息。
PLDA(Probabilistic Linear Discriminant Analysis,概率线性判别分析)被引入到说话人识别领域之前,最先是按照人脸识别中PLDA的形式来对I-vector分解成如下形式:
wij=μ+Vyi+Uxij+εij;
其中,wij表示第i个说话人的第j个I-vector;μ表示所有I-vector的均值向量;V表示本征音空间矩阵,或称之为说话人空间矩阵;U表示本征信道空间矩阵,或称之为信道空间矩阵;yi表示说话人因子;xij表示信道因子;εij表示残差或噪声因子。yi、xij和εij的先验分布按照不同类型的PLDA模型有所不同。在高斯PLDA模型它们都服从高斯分布,在重尾PLDA模型他们服从学生分布。实际上I-vector本身的分布并不能很好地符合高斯分布,因而高斯PLDA模型最初性能要远差于重尾PLDA,但是在提出了I-vector长度规整技术,对I-vector进行长度规整可以使它更加服从高斯分布,长度规整后的I-vector再采用高斯PLDA进行建模的性能可以达到重尾PLDA的效果,而且高斯PLDA的模型复杂度和实际应用时的计算复杂度远远小于重尾PLDA,因此后来的PLDA系统基本都采用长度规整后的I-vector接高斯PLDA模型。
基于上述相关技术,处理短时说话人语音时,由于性能下降导致说话人聚类效果较差。
发明内容
本发明的主要目的在于提供一种说话人分段聚类方法及装置,以解决相关技术中处理短时说话人语音时,性能下降导致说话人聚类效果较差的问题。
根据本发明的一个方面,提供了一种说话人分段聚类方法,包括:将待聚类语音划分为多个子语音段;通过权重联合概率线性判别分析WT-PLDA模型对基于划分得到的各子语音段的I-vector提取出各子语音段的特征信息W-vector,所述WT-PLDA模型的模型参数至少包括:均值向量、说话人子空间的投影矩阵、说话人因子的隐藏变量以及残差因子;通过概率线性判别分析PLDA根据划分后多个子语音段的所述W-vector对该多个子语音段循环进行多次聚类,直至所述多个子语音段被聚类为两类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心;中国科学院声学研究所,未经国家计算机网络与信息安全管理中心;中国科学院声学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910015449.8/2.html,转载请声明来源钻瓜专利网。