[发明专利]一种语音采集方法、装置、设备及存储介质在审
申请号: | 201811223872.9 | 申请日: | 2018-10-19 |
公开(公告)号: | CN111081257A | 公开(公告)日: | 2020-04-28 |
发明(设计)人: | 廖海霖;张新;毛跃辉;郑文成;李保水;秦萍 | 申请(专利权)人: | 珠海格力电器股份有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/04;G10L17/00;G10L15/22 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 黄志华 |
地址: | 519070*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 采集 方法 装置 设备 存储 介质 | ||
本发明公开了一种语音采集方法、装置、设备及存储介质,用以提供一种在多人会话场景下确定有效语音的方法,可以从多人的混合语音信息中识别出有效语音信息,进而实现对多人会话场景的语音权限控制,提升使用体验。该方法包括:从获得的至少两个用户的混合语音信息中,确定每个用户分别对应的语音信息;提取每个用户的语音信息的声纹特征,以获得对应的至少两种声纹特征;确定属于预定声纹特征集的目标声纹特征;将每种目标声纹特征对应的语音特征参数输入预定有效语音识别模型,以获得每种目标声纹特征对应的语音有效权重;根据获得的语音有效权重,从目标声纹特征对应的语音信息中确定有效语音信息。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音采集方法、装置、设备及存储介质。
背景技术
语音采集技术在现代社会中的应用越来越广泛,例如在教育、会议、家电控制等各个方面都有着广泛的应用,在语音识别、语音控制、智能交互等领域对语音采集技术有比较高的指标要求,要求采集的语音清晰、准确。
然而,在复杂的环境中采集语音时,例如在包括多个用户的环境中采集到的语音通常是多个用户的混合语音信息,对于所有用户的语音信息,难以确定哪些语音信息具有语音主导权限(例如发言人权限),所以在多人会话场景下确定有效语音信息是非常必要的,因为这关系到多人会话场景下的主导权限的确定,然而目前还缺乏这样的确定方案。
发明内容
本发明实施例提供一种语音采集方法、装置、设备及存储介质,用以提供一种在多人会话场景下确定有效语音的方法,可以从多人的混合语音信息中识别出有效语音信息,进而实现对多人会话场景的语音权限控制,提升使用体验。
第一方面,提供一种语音采集方法,所述方法包括:
从获得的至少两个用户的混合语音信息中,确定每个用户分别对应的语音信息;
提取每个用户的语音信息的声纹特征,以获得对应的至少两种声纹特征;
确定属于预定声纹特征集的目标声纹特征;
将每种目标声纹特征对应的语音特征参数输入预定有效语音识别模型,以获得每种目标声纹特征对应的语音有效权重;
根据获得的语音有效权重,从目标声纹特征对应的语音信息中确定有效语音信息。
可选的,所述语音特征参数包括声纹特征对应的语音频次、本次语音持续时长和本次语音顺序中的至少一种。
可选的,所述预定有效语音识别模型包括语音频次越高对应权重越大、本次语音持续时长越长对应权重越大、本次语音顺序越前对应权重越大中的至少一种语音有效权重计算规则。
可选的,所述方法还包括:
若所述至少两种声纹特征均不属于所述预定声纹特征集,则按照附加确定规则从所述至少两种声纹特征对应的语音信息中确定有效语音信息。
可选的,按照附加确定规则从所述至少两种声纹特征对应的语音信息中确定有效语音信息,包括:
将本次语音时间最长的语音信息确定为所述有效语音信息;或者,
根据每个用户的语音信息的信号接收强度确定每个用户的位置,并将位置距离最近的用户的语音信息确定为所述有效语音信息。
可选的,按照附加确定规则从所述至少两种声纹特征对应的语音信息中确定有效语音信息,包括:
对每个用户的语音信息分别进行语音识别,以获得对应的语音内容;
将包括预设关键词的语音信息确定为所述有效语音信息。
可选的,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海格力电器股份有限公司,未经珠海格力电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811223872.9/2.html,转载请声明来源钻瓜专利网。