[发明专利]一种说话人标注方法、装置、设备及存储介质在审

申请号：	202010249826.7	申请日：	2020-04-01
公开（公告）号：	CN111462759A	公开（公告）日：	2020-07-28
发明（设计）人：	宋亚楠;刘庆峰;刘聪;魏思;王智国;高建清;潘嘉;胡国平	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	G10L17/02	分类号：	G10L17/02;G10L17/04;G10L25/51
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	李晓光
地址：	230088 安徽***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种说话标注方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提出一种说话人标注方法、装置、设备及存储介质，该方法包括：获取待标注语音数据的声学特征；至少根据所述待标注语音数据的声学特征、已标注语音数据中出现过的说话人的特征，标注所述待标注语音数据的说话人；其中，所述已标注语音数据中出现过的说话人的特征，基于在对所述已标注语音数据进行说话人标注过程中学习到的说话人与其语音数据的声学特征之间的关联联系，所确定。采用上述方法能够实现对语音数据的说话人标注，并且能够保证较高的说话人标注准确度。

技术领域

本申请涉及自然语言处理技术领域，尤其涉及一种说话人标注方法、装置、设备及存储介质。

背景技术

随着人工神经网络在说话人识别领域的飞速发展，对带有说话人标注的语音数据的需求越来越急迫，这些数据可以被用来优化说话人识别模型，这将对说话人识别效果的提升具有重要的意义。

现阶段，人工智能技术在为用户提供语音服务时，可以积累大量的语音数据，这些语音数据可以用于优化说话人识别模型，但是所积累的语音数据的说话人标注却无法直接获取，只能后期自行标注。因此，如何能够实现对语音数据的说话人标注，是说话人识别领域的现实需求。

发明内容

基于上述需求，本申请实施例提出一种说话人标注方法、装置、设备及存储介质，至少能够实现对语音数据的说话人标注。

一种说话人标注方法，包括：

获取待标注语音数据的声学特征；

至少根据所述待标注语音数据的声学特征、已标注语音数据中出现过的说话人的特征，标注所述待标注语音数据的说话人；

其中，所述已标注语音数据中出现过的说话人的特征，基于在对所述已标注语音数据进行说话人标注过程中学习到的说话人与其语音数据的声学特征之间的关联联系，所确定。

一种说话人标注装置，包括：

特征提取单元，用于获取待标注语音数据的声学特征；

说话人标注单元，用于至少根据所述待标注语音数据的声学特征、已标注语音数据中出现过的说话人的特征，标注所述待标注语音数据的说话人；

一种说话人标注设备，包括：

存储器和处理器；

其中，所述存储器与所述处理器连接，用于存储程序；

所述处理器通过执行所述存储器中存储的程序，实现上述的说话人标注方法。

一种存储介质，所述存储介质上存储有计算机程序，所述计算机程序被处理器执行时，实现上述的说话人标注方法。

本申请所提出的说话人标注方法，能够根据待标注语音数据的声学特征，以及已标注语音数据中出现过的说话人的特征，对待标注语音数据的说话人进行标注。并且，在本申请上述方案中所应用的已标注语音数据中出现过的说话人的特征，基于在对已标注语音数据进行说话人标注过程中学习到的说话人与其语音数据的声学特征之间的关联关系所确定。

可以理解，本申请提出的说话人标注方法在对语音数据进行说话人标注的过程中，不断的学习说话人与其语音数据的声学特征之间的关联关系，并基于学习到的关联关系确定说话人特征，则随着对说话人的语音数据的标注越来越多，对说话人与其语音数据的声学特征之间的关联关系的学习越来越全面、越来越深入，可以抵消环境、信道、情感等因素的变化对说话人特征的影响，从而使得对说话人的特征把握得越来越准确。

则按照上述方式确定已标注语音数据中出现过的说话人的特征后，将其用于对新的待标注语音数据进行说话人标注，可以提高说话人标注的准确度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司，未经科大讯飞股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010249826.7/2.html，转载请声明来源钻瓜专利网。

上一篇：基于深度学习的天线姿态参数检测方法、装置及存储介质
下一篇：风险信息的处理方法和装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种说话人标注方法、装置、设备及存储介质在审

专利文献下载