[发明专利]一种语音采集方法、装置、设备及存储介质在审

申请号：	201811223872.9	申请日：	2018-10-19
公开（公告）号：	CN111081257A	公开（公告）日：	2020-04-28
发明（设计）人：	廖海霖;张新;毛跃辉;郑文成;李保水;秦萍	申请（专利权）人：	珠海格力电器股份有限公司
主分类号：	G10L17/02	分类号：	G10L17/02;G10L17/04;G10L17/00;G10L15/22
代理公司：	北京同达信恒知识产权代理有限公司 11291	代理人：	黄志华
地址：	519070***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音采集方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种语音采集方法、装置、设备及存储介质，用以提供一种在多人会话场景下确定有效语音的方法，可以从多人的混合语音信息中识别出有效语音信息，进而实现对多人会话场景的语音权限控制，提升使用体验。该方法包括：从获得的至少两个用户的混合语音信息中，确定每个用户分别对应的语音信息；提取每个用户的语音信息的声纹特征，以获得对应的至少两种声纹特征；确定属于预定声纹特征集的目标声纹特征；将每种目标声纹特征对应的语音特征参数输入预定有效语音识别模型，以获得每种目标声纹特征对应的语音有效权重；根据获得的语音有效权重，从目标声纹特征对应的语音信息中确定有效语音信息。

技术领域

本发明涉及语音处理技术领域，尤其涉及一种语音采集方法、装置、设备及存储介质。

背景技术

语音采集技术在现代社会中的应用越来越广泛，例如在教育、会议、家电控制等各个方面都有着广泛的应用，在语音识别、语音控制、智能交互等领域对语音采集技术有比较高的指标要求，要求采集的语音清晰、准确。

然而，在复杂的环境中采集语音时，例如在包括多个用户的环境中采集到的语音通常是多个用户的混合语音信息，对于所有用户的语音信息，难以确定哪些语音信息具有语音主导权限(例如发言人权限)，所以在多人会话场景下确定有效语音信息是非常必要的，因为这关系到多人会话场景下的主导权限的确定，然而目前还缺乏这样的确定方案。

发明内容

本发明实施例提供一种语音采集方法、装置、设备及存储介质，用以提供一种在多人会话场景下确定有效语音的方法，可以从多人的混合语音信息中识别出有效语音信息，进而实现对多人会话场景的语音权限控制，提升使用体验。

第一方面，提供一种语音采集方法，所述方法包括：

从获得的至少两个用户的混合语音信息中，确定每个用户分别对应的语音信息；

提取每个用户的语音信息的声纹特征，以获得对应的至少两种声纹特征；

确定属于预定声纹特征集的目标声纹特征；

将每种目标声纹特征对应的语音特征参数输入预定有效语音识别模型，以获得每种目标声纹特征对应的语音有效权重；

根据获得的语音有效权重，从目标声纹特征对应的语音信息中确定有效语音信息。

可选的，所述语音特征参数包括声纹特征对应的语音频次、本次语音持续时长和本次语音顺序中的至少一种。

可选的，所述预定有效语音识别模型包括语音频次越高对应权重越大、本次语音持续时长越长对应权重越大、本次语音顺序越前对应权重越大中的至少一种语音有效权重计算规则。

可选的，所述方法还包括：

若所述至少两种声纹特征均不属于所述预定声纹特征集，则按照附加确定规则从所述至少两种声纹特征对应的语音信息中确定有效语音信息。