[发明专利]一种基于因子分析的说话人分段聚类方法及系统在审
| 申请号: | 201710395341.7 | 申请日: | 2017-05-27 |
| 公开(公告)号: | CN107342077A | 公开(公告)日: | 2017-11-10 |
| 发明(设计)人: | 计哲;颜永红;安茂波;陈燕妮;苗权;李鹏;张震;万辛 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/07;G10L15/14;G10L17/04;G10L17/14 |
| 代理公司: | 北京君尚知识产权代理事务所(普通合伙)11200 | 代理人: | 邱晓锋 |
| 地址: | 100029*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明涉及一种基于因子分析的说话人分段聚类方法及系统。该方法包括1)提取训练语音的声学特征,训练高斯混合通用背景模型,进而训练总变化因子模型和高斯概率线性判别分析模型;2)对测试语音进行分段并提取语音片段的声学特征;3)依据高斯混合通用背景模型和总变化因子模型将提取的声学特征映射为总变化量因子,加载高斯概率线性判别分析模型,根据总变化量因子计算任意两语音片段之间的对数似然比得分;4)选择得分最高的两类进行合并,根据层次聚类的方法逐步迭代至收敛,最终输出说话人分段聚类结果。本发明将总变化因子的不确定性引入到高斯概率线性判别分析模型进行训练和打分,能够提升短时语音片段上的基于因子分析的系统性能。 | ||
| 搜索关键词: | 一种 基于 因子分析 说话 分段 方法 系统 | ||
【主权项】:
一种基于因子分析的说话人分段聚类方法,其步骤包括:1)提取训练语音的声学特征,训练高斯混合通用背景模型,进而训练总变化因子模型和高斯概率线性判别分析模型;2)输入测试语音,对测试语音进行分段并提取语音片段的声学特征;3)依据高斯混合通用背景模型和总变化因子模型,将提取的声学特征映射为总变化量因子,并加载高斯概率线性判别分析模型,根据总变化量因子计算任意两语音片段之间的对数似然比得分;4)选择得分最高的两类进行合并,根据层次聚类的方法逐步迭代至收敛,最终输出说话人分段聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710395341.7/,转载请声明来源钻瓜专利网。
- 上一篇:语音和声音的识别方法发明
- 下一篇:对话策略优化的冷启动系统和方法





