[发明专利]一种语音处理方法、装置及系统有效

专利信息
申请号: 201310222683.0 申请日: 2013-06-06
公开(公告)号: CN103327014A 公开(公告)日: 2013-09-25
发明(设计)人: 彭远疆;刘洪 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: H04L29/06 分类号: H04L29/06;G10L19/00
代理公司: 上海波拓知识产权代理有限公司 31264 代理人: 韩绍君
地址: 518044 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 处理 方法 装置 系统
【说明书】:

技术领域

发明涉及语音处理技术,特别涉及一种语音处理方法、装置及系统。

背景技术

在语音处理系统中,当需要支持多方语音交流时,经常需要进行多路语音的混音处理。多路混音是指把多路语音波形叠加成单独一路语音的方法或过程。最简单的混音即是把所有输入通道的语音原始波形直接相加,得到一路混音后语音原始波形。但在实际的多路混音系统中,由于参与混音的输入通道路数一般比较多,简单地把所有输入语音的原始波形直接相加,会导致输出背景噪音变大和输出溢出等一系列问题。所以实际的混音系统往往会按照一定的第一混音策略,在同一时刻仅选取少数几路(一般选2-5路)输入语音进行实际混音,以尽量避免背景噪声增大和输出溢出等问题。

在实际语音通讯系统中,按混音处理所处的不同位置,可以分为服务器混音和客户端混音这两种方式。其中,服务器混音具有较高的混音质量,但由混音处理带来的资源消耗大,尤其是在语音用户数量大时服务器不堪重负。客户端混音可以减少服务器的资源负担,但其混音质量较低,无法满足高品质需求场合例如语音视频会议。

发明内容

有鉴于此,有必要提供一种语音处理方法、装置及系统,其可减轻语音服务器的资源消耗,并能提升混音质量。

一种语音处理方法,包括:获取要发送的语音码流;对应于该语音码流获取用于供语音服务器决定混音策略的语音控制信息;将获取的语音码流及语音控制信息发送至语音服务器中;接收该服务器返回的至少一路语音码流;以及输出该至少一路语音码流。

一种语音处理方法,用于语音服务器中,包括:接收多个客户端发送的语音码流以及用于供该语音服务器决定混音策略的语音控制信息;混音策略生成步骤:参考该语音控制信息生成第一混音策略及第二混音策略;根据该第一混音策略分别为每个客户端选择要进行混音处理的多路语音码流;根据该第二混音策略将该要进行混音处理的多路语音码流返回至对应的客户端,或者对该要进行混音处理的多路语音码流进行混音处理后返回至对应的客户端。

一种语音处理方法,包括:在多个客户端中分别进行以下步骤:获取要发送的语音码流;对应于该语音码流获取用于供语音服务器决定混音策略的语音控制信息;以及将该语音码流及语音控制信息发送至一个语音服务器中;在该语音服务器中进行以下步骤:接收该多个客户端发送的语音码流以及语音控制信息;参考该语音控制信息生成第一混音策略及第二混音策略;根据该第一混音策略分别为每个客户端选择要进行混音处理的多路语音码流;根据该第二混音策略将该要进行混音处理的多路语音码流返回至对应的客户端,或者对该要进行混音处理的多路语音码流进行混音处理后返回至对应的客户端。

一种语音处理装置,包括:第一获取单元,用于获取要发送的语音码流;第二获取单元,用于对应于该语音码流获取用于供语音服务器决定混音策略的语音控制信息;发送单元,用于将获取的语音码流及语音控制信息发送至语音服务器中;接收单元,用于接收该服务器返回的至少一路语音码流;以及输出单元,用于输出该至少一路语音码流。

一种语音处理装置,用于语音服务器中,该装置包括:接收单元,用于接收多个客户端发送的语音码流以及用于供语音服务器决定混音策略的语音控制信息;混音策略生成单元,用于参考该语音控制信息生成第一混音策略及第二混音策略;选择单元,用于根据该第一混音策略分别为每个客户端选择要进行混音处理的多路语音码流;混音处理单元,用于根据该第二混音策略将该要进行混音处理的多路语音码流返回至对应的客户端,或者对该要进行混音处理的多路语音码流进行混音处理后返回至对应的客户端。

一种语音处理系统,包括:客户端模块以及服务器模块,分别位于一个客户端以及语音服务器中;该客户端模块包括:第一获取单元,用于获取要发送的语音码流;第二获取单元,用于对应于该语音码流获取用于供该服务器模块决定混音策略的语音控制信息;发送单元,用于将获取的语音码流及语音控制信息发送至该服务器模块;该服务器模块包括:接收单元,用于接收多个客户端发送的语音码流以及用于供该服务器模块决定混音策略的语音控制信息;混音策略生成单元,用于参考该语音控制信息生成第一混音策略及第二混音策略;选择单元,用于根据该第一混音策略分别为每个客户端选择要进行混音处理的多路语音码流;混音处理单元,用于根据该第二混音策略将该要进行混音处理的多路语音码流返回至对应的客户端模块,或者对该要进行混音处理的多路语音码流进行混音处理后返回至对应的客户端模块。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310222683.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top