[发明专利]在语音识别系统中传送语音结束标记的方法无效
申请号: | 200580047793.1 | 申请日: | 2005-12-28 |
公开(公告)号: | CN101116304A | 公开(公告)日: | 2008-01-30 |
发明(设计)人: | 亚历山大·费里克斯 | 申请(专利权)人: | 法国电信公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G10L15/28;G10L11/02 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 刘雅红 |
地址: | 法国*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 系统 传送 结束 标记 方法 | ||
技术领域
本发明涉及一种在以不连续传送模式工作的分布式语音识别系统中传送语音结束标记的方法。
本发明发现在语音识别的一般领域中存在特别有利的应用。
更具体地,本发明的背景是如在ETSI标准ES 201 108、ES 202 212和IETF文件RFC 3557中定义的分布式语音识别(DSR)。
背景技术
作为一般规则,语音识别方法涉及从由说话者所说的语音分段中提取声学参数的第一阶段,其中该说话者能够是终端(尤其移动电话)的用户。在第二阶段中,由专用语音识别系统处理所获得的声学参数以恢复所说的语音分段的语音内容。既然已经恢复,然后合并该语音识别系统的服务器能够对该说话者所说的做出反应。例如,该服务器是在移动电话系统中的话音服务器。
分布式语音识别(DSR)在该终端本身实现语音识别的第一阶段,即提取声学参数,并且仅向该服务器传送该结果。当选择这些参数来优化语音识别性能时,在等价于用于在人类间会话的标准编码器/解码器(编解码器)的比特率处获得在语音识别中的明确改进。
上面提及的文件RFC 3557描述传送作为文件RFC 3550的实时协议(RTP)的有效负荷的声学参数。在文件RFC 3557中提出的DSR的一个版本涉及不连续传送(DTX),其中该终端非连续地仅在语音分段期间向该服务器发送数据。为此,当该用户按“按键讲话”装置的按键或在话音激活检测器(VAD)的控制下时才发送数据。不连续传送的好处无疑是其节约在无声时间段期间的带宽。
当然,如果使用DTX模式,则对于该话音服务器有必要知道该语音分段何时结束,例如,为了能够向该语音识别系统指示已经接收所有声学参数数据并且其可以立刻实现该识别操作以及完成其结果。文件RFC 3557为此目的提出包含空帧和充当语音结束标记的特殊数据分组。
DTX模式的缺点是:如果在数据传送期间空帧的分组在网络中丢失,则该服务器不再被告知该语音结束分段,并且无法向该语音识别系统给出任何执行指令。作为结果,该服务器无法响应该用户所说的,以及该用户于是遭受长且不可接受的等待时间段。
为补救该缺点,已经提出如果到给定的时间周期结束前没有接收语音结束分段则导致该服务器起反应的超时机制。但是,这种盲目型的机制不可避免地慢,因为在正常会话中其与间或长时延的语音分段相关联。
发明内容
因此由本发明的主题解决的技术问题是提出一种在以不连续传送模式工作的分布式语音识别系统中传送语音结束标记的方法,在其中发送由无声时间段跟随的语音分段,每个语音分段以语音结束标记终止,当面临传送丢失时,此方法应当使由语音结束标记组成的信令信道比超时机制更加鲁棒(robust),由此保证时延仅与网络条件关联并且在不可避免地长的超时时间段中不被任意设置。
本发明对所述技术问题的解决方案是贯穿跟随所述语音分段的无声时间段内连续地重传所述语音结束标记。
因此即便在语音分段的末端处发生传送丢失,导致在截尾分段中包含的语音结束标记丢失,一旦网络再次运行分段结束信息就仍然能够被传达至该服务器,因为然后该服务器能够接收在传送恢复后马上重传的语音结束标记。因此当被通知分段结束时该服务器能够非常有效地响应,或者指示该识别操作的执行或者拒绝由于线路损失被截尾的分段。
该语音结束标记的重传时间,即在两个连续的重传标记之间的时间段的持续时间,必须允许以下折衷:
●如果其太慢,该用户可以察觉长的等待时间,即如以上提及的超时机制相同的缺点;
●如果其太快,在无声时间段期间消耗的带宽能够达到语音时间段的带宽,由此抵消不连续传送DTX模式的好处。而且,由于该用户的时间限度和分组丢失的时间相关性,借此重传两个太接近的语音结束标记具有在相同时间被丢失的极大可能,故该速度可能会没有用。
可能有两种选择:在第一种选择中,在相同持续时间的时间间隔中重传所述语音结束标记,而在第二种选择中在持续时间增加的时间间隔中重传所述语音结束标记。该第二种选择依照带宽是有利的,但是具有重新引入长等待时间的风险。
根据本发明,满意的折衷是所述的持续时间将达到一秒的数量级。
在本发明的一个特定实施例中,当接收确认重传的语音结束标记的消息时,中断所述语音结束标记的重传。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于法国电信公司,未经法国电信公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200580047793.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:吸尘器地刷
- 下一篇:一种自环光收发模块及其测试装置和方法