[发明专利]语音交流中话语权分配方法、装置、设备及存储介质在审

申请号：	202210847338.5	申请日：	2022-07-19
公开（公告）号：	CN115174534A	公开（公告）日：	2022-10-11
发明（设计）人：	黄林森	申请（专利权）人：	科大讯飞股份有限公司
主分类号：	H04L65/403	分类号：	H04L65/403;G10L25/87
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	王雨
地址：	230088 安徽***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音交流话语权分配方法装置设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种语音交流中话语权分配方法、装置、设备及存储介质，本申请通过对交流各方分别进行收音，得到收录的音频，在设定的每一检测周期结束时，基于最近一个检测周期收音得到的音频，从交流各方中确定出音频来源的目标方，进而将话语权分配给该目标方，以指示目标方的客户端进行收音，以及，在其余各交流方的客户端上显示对所述目标方收音的音频的识别处理结果。由此可见，本申请的方法能够通过自动对交流各方进行收音以及按照检测周期确定音频来源的目标方，从而实现自动将话语权分配给目标方，交流过程中各方无需分心操控电子设备，可以专注于聆听和语音表达，进而提升了交流效率及交流质量。

技术领域

本申请涉及语音交互技术领域，更具体的说，是涉及一种语音交流中话语权分配方法、装置、设备及存储介质。

背景技术

随着语音识别技术的发展，基于具备语音识别功能的电子设备进行线上、线下形式的语音交流，极大方便了用户的工作、生活。示例如，线上多方进行音、视频会议，线下的会议场景中，借助语音识别或翻译设备，进行会议的发言、录音、语音识别、语音翻译等。

目前，在多方语音交流过程中，对各交流方的交流节奏引导还不够完善。以线下会议场景为例，现有技术是每轮会话初始需要发言的一方手动点击设备屏幕，语音识别或翻译设备通过判断各方点击时间先后顺序，来判断哪一方先点击，进而将当前轮次的话语权分配给先点击的一方。其他交流方若要发言需要强行再次点击已侧设备屏幕，以获取话语权。显然，这种方式使得各交流方需要分心在操控电子设备上，不能专注于聆听和语音表达，导致交流效率和质量不高。

发明内容

鉴于上述问题，提出了本申请以便提供一种语音交流中话语权分配方法、装置、设备及存储介质，以解决现有技术需要交流方分心操作电子设备，导致交流效率和质量不高的问题。具体方案如下：

第一方面，提供了一种语音交流中话语权分配方法，包括：

对交流各方分别进行收音，得到收录的音频；

在每一检测周期结束时，基于最近一个检测周期收音得到的音频，从交流各方中确定出音频来源的目标方；

将话语权分配给所述目标方，以指示所述目标方的客户端进行收音，以及，在其余各交流方的客户端上显示对所述目标方收音的音频的识别处理结果。

第二方面，提供了一种语音交流中话语权分配装置，包括：

收音单元，用于对交流各方分别进行收音，得到收录的音频；

音源确定单元，用于在每一检测周期结束时，基于最近一个检测周期收音得到的音频，从交流各方中确定出音频来源的目标方；

话语权分配单元，用于将话语权分配给所述目标方，以指示所述目标方的客户端进行收音，以及，在其余各交流方的客户端上显示对所述目标方收音的音频的识别处理结果。

第三方面，提供了一种电子设备，包括：存储器和处理器；

所述存储器，用于存储程序；