[发明专利]无监督角色识别方法、装置、电子设备及存储介质在审
| 申请号: | 202010790776.3 | 申请日: | 2020-08-07 |
| 公开(公告)号: | CN111985231A | 公开(公告)日: | 2020-11-24 |
| 发明(设计)人: | 李娜;罗红 | 申请(专利权)人: | 中移(杭州)信息技术有限公司;中国移动通信集团有限公司 |
| 主分类号: | G06F40/289 | 分类号: | G06F40/289;G06F16/35 |
| 代理公司: | 上海晨皓知识产权代理事务所(普通合伙) 31260 | 代理人: | 成丽杰 |
| 地址: | 310011 浙江省杭州*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 监督 角色 识别 方法 装置 电子设备 存储 介质 | ||
1.一种无监督角色识别方法,其特征在于,所述方法包括:
将语音信息转译为单词集和与所述单词集对应的时间集;
根据所述时间集和预设的时间间隔阈值,对所述单词集进行单词合并,得到语句集;
通过多维度提取所述语音信息的梅尔倒谱特征,得到多组不同维度的梅尔倒谱特征组;
对多组不同维度的所述梅尔倒谱特征组进行角色标签聚类,得到多组原始角色标签集;
根据预先构建的标签选取原则,从多组所述原始角色标签集中筛选原始角色标签,得到标准角色标签集;
根据预构建的文本关键字识别机制,识别所述语句集内关键字,得到关键字集,根据所述关键字集和所述标准角色标签集执行对所述语音信息的角色识别。
2.根据权利要求1所述的无监督角色识别方法,其特征在于,所述对多组不同维度的所述梅尔倒谱特征组进行角色标签聚类,得到多组原始角色标签集,包括:
将多组不同维度的所述梅尔倒谱特征组进行降维操作,得到多组单维度梅尔倒谱特征组;
初始化角色标签聚类的最大聚类次数、角色标签类别数及角色标签聚类计数器;
根据所述最大聚类次数、所述角色标签类别数及所述角色标签聚类计数器,对每组单维度梅尔倒谱特征组进行角色标签聚类,得到多组所述原始角色标签集。
3.根据权利要求2所述的无监督角色识别方法,其特征在于,所述根据所述最大聚类次数、所述角色标签类别数及所述角色标签聚类计数器,对每组单维度梅尔倒谱特征组进行角色标签聚类,得到多组所述原始角色标签集,包括:
步骤A:根据所述角色标签类别数,确定所述单维度梅尔倒谱特征组的原始类别中心点集,计算所述原始类别中心点集的类别中心点与所述单维度梅尔倒谱特征组内特征数据的距离值,得到原始距离值集,并对所述角色标签聚类计数器执行计数操作;
步骤B:根据所述原始距离值集,重新确定所述原始类别中心点集的类别中心,得到标准类别中心集;
步骤C:计算所述标准类别中心集的误差值;
步骤D:在所述误差值大于预设的误差阈值时,判断所述角色标签聚类计数器与所述最大聚类次数的大小关系;
步骤E:在所述角色标签聚类计数器大于或等于所述最大聚类次数时,根据所述标准类别中心集得到所述原始角色标签集;
步骤F、在所述角色标签聚类计数器小于所述最大聚类次数时,计算所述标准类别中心集的类别中心点与所述单维度梅尔倒谱特征组内特征数据的距离值,得到标准距离值集,根据所述标准距离值集,重新确定所述标准类别中心点集,并返回步骤C;
步骤G、在所述误差值小于或等于所述误差阈值时,根据所述标准类别中心集得到所述原始角色标签集。
4.根据权利要求3所述的无监督角色识别方法,其特征在于,所述计算所述标准类别中心集的误差值,包括:
计算所述标准类别中心集内每个标准类别中心与所述单维度梅尔倒谱特征组内特征数据的距离值,得到特征-类别中心距离值;
汇总每个特征-类别中心距离值,并根据预设的误差公式计算得到所述误差值。
5.根据权利要求2所述的无监督角色识别方法,其特征在于,所述将多组不同维度的所述梅尔倒谱特征组进行降维操作之前,所述方法还包括:
采用下述方法对多组不同维度的所述梅尔倒谱特征组进行归一化操作;
其中,表示归一化操作后的梅尔倒谱特征组,xj表示归一化操作前的梅尔倒谱特征组,mean(xj)表示梅尔倒谱特征的平均值,std(xj)表示梅尔倒谱特征的归一化范围。
6.根据权利要求1所述的无监督角色识别方法,其特征在于,所述通过多维度提取所述语音信息的梅尔倒谱特征,得到多组不同维度的梅尔倒谱特征组,包括:
对所述语音信息进行包括采样、量化、预加重、分帧、加窗的预处理操作;
将完成所述预处理操作的语音信息进行傅里叶变换得到平稳语音信息;
将所述平稳语音信息输入至预构建的Mel滤波器组进行多维度提取,得到不同维度的梅尔倒谱特征组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移(杭州)信息技术有限公司;中国移动通信集团有限公司,未经中移(杭州)信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010790776.3/1.html,转载请声明来源钻瓜专利网。





